source: tags/ms_r16q3/TOOLS/arb_probe.cxx

Last change on this file was 15176, checked in by westram, 8 years ago
  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
File size: 133.7 KB
Line 
1// =============================================================== //
2//                                                                 //
3//   File      : arb_probe.cxx                                     //
4//   Purpose   :                                                   //
5//                                                                 //
6//   Institute of Microbiology (Technical University Munich)       //
7//   http://www.arb-home.de/                                       //
8//                                                                 //
9// =============================================================== //
10
11#include <PT_com.h>
12#include <arbdb.h>
13
14#include <client.h>
15#include <servercntrl.h>
16
17#include <arb_defs.h>
18#include <arb_strbuf.h>
19#include <arb_diff.h>
20#include <RegExpr.hxx>
21
22#include <algorithm>
23#include <string> // need to include before test_unit.h
24#include <unistd.h>
25
26struct apd_sequence {
27    apd_sequence *next;
28    const char *sequence;
29};
30
31struct Params {
32    int         DESIGNCLIPOUTPUT;
33    int         SERVERID;
34    const char *DESIGNNAMES;
35    int         DESIGNPROBELEN;
36    int         DESIGNMAXPROBELEN;
37    const char *DESIGNSEQUENCE;
38
39    int         MINTEMP;
40    int         MAXTEMP;
41    int         MINGC;
42    int         MAXGC;
43    int         MAXBOND;
44    int         MINPOS;
45    int         MAXPOS;
46    int         MISHIT;
47    int         MINTARGETS;
48    const char *SEQUENCE;
49    int         MISMATCHES;
50    int         ACCEPTN;
51    int         LIMITN;
52    int         MAXRESULT;
53    int         COMPLEMENT;
54    int         WEIGHTED;
55
56    apd_sequence *sequence;
57
58    int         ITERATE;
59    int         ITERATE_AMOUNT;
60    int         ITERATE_READABLE;
61    const char *ITERATE_SEPARATOR;
62    const char *ITERATE_TU;
63
64    const char *DUMP;
65};
66
67
68struct gl_struct {
69    aisc_com  *link;
70    T_PT_MAIN  com;
71    T_PT_LOCS  locs;
72    int        pd_design_id;
73
74    gl_struct()
75        : link(0),
76          pd_design_id(0)
77    {
78    }
79
80};
81
82static Params    P;
83static gl_struct pd_gl;
84
85static int init_local_com_struct() {
86    const char *user = GB_getenvUSER();
87
88    if (aisc_create(pd_gl.link, PT_MAIN, pd_gl.com,
89                    MAIN_LOCS, PT_LOCS, pd_gl.locs,
90                    LOCS_USER, user,
91                    NULL)) {
92        return 1;
93    }
94
95    return 0;
96}
97
98static const char *AP_probe_pt_look_for_server(ARB_ERROR& error) {
99    // DRY vs  ../MULTI_PROBE/MP_noclass.cxx@MP_probe_pt_look_for_server
100    // DRY vs  ../PROBE_DESIGN/probe_design.cxx@PD_probe_pt_look_for_server
101    const char *server_tag = GBS_ptserver_tag(P.SERVERID);
102    error = arb_look_and_start_server(AISC_MAGIC_NUMBER, server_tag);
103
104    const char *result = NULL;
105    if (!error) {
106        result = GBS_read_arb_tcp(server_tag);
107        if (!result) error = GB_await_error();
108    }
109    return result;
110}
111
112class PTserverConnection {
113    static int count;
114    bool       need_close;
115public:
116    PTserverConnection(ARB_ERROR& error)
117        : need_close(false)
118    {
119        if (count) {
120            error = "Only 1 PTserverConnection allowed";
121        }
122        else {
123            ++count;
124            const char *servername = AP_probe_pt_look_for_server(error);
125            if (servername) {
126                GB_ERROR openerr = NULL;
127                pd_gl.link       = aisc_open(servername, pd_gl.com, AISC_MAGIC_NUMBER, &openerr);
128                if (openerr) {
129                    error = openerr;
130                }
131                else {
132                    if (!pd_gl.link) {
133                        error = "Cannot contact PT_SERVER [1]";
134                    }
135                    else if (init_local_com_struct()) {
136                        error = "Cannot contact PT_SERVER [2]";
137                    }
138                    else {
139                        need_close = true;
140                    }
141                }
142            }
143        }
144    }
145    ~PTserverConnection() {
146        if (need_close) {
147            aisc_close(pd_gl.link, pd_gl.com);
148            pd_gl.link = 0;
149        }
150        --count;
151    }
152};
153int PTserverConnection::count = 0;
154
155static char *AP_dump_index_event(ARB_ERROR& error) {
156    PTserverConnection contact(error);
157
158    char *result = NULL;
159    if (!error) {
160        aisc_put(pd_gl.link, PT_MAIN, pd_gl.com,
161                 MAIN_DUMP_NAME, P.DUMP,
162                 NULL);
163
164        if (aisc_get(pd_gl.link, PT_MAIN, pd_gl.com,
165                     MAIN_DUMP_INDEX, &result,
166                     NULL)) {
167            error = "Connection to PT_SERVER lost (1)";
168        }
169        else {
170            result = ARB_strdup("ok");
171        }
172    }
173    return result;
174}
175
176static char *AP_probe_iterate_event(ARB_ERROR& error) {
177    PTserverConnection contact(error);
178
179    char *result = NULL;
180    if (!error) {
181        T_PT_PEP pep;
182        int      length = P.ITERATE;
183
184        if (aisc_create(pd_gl.link, PT_LOCS, pd_gl.locs,
185                        LOCS_PROBE_FIND_CONFIG, PT_PEP, pep,
186                        PEP_PLENGTH,   (long)length,
187                        PEP_RESTART,   (long)1,
188                        PEP_READABLE,  (long)P.ITERATE_READABLE,
189                        PEP_TU,        (long)P.ITERATE_TU[0],
190                        PEP_SEPARATOR, (long)P.ITERATE_SEPARATOR[0],
191                        NULL))
192        {
193            error = "Connection to PT_SERVER lost (1)";
194        }
195
196        if (!error) {
197            int amount          = P.ITERATE_AMOUNT;
198            int amount_per_call = AISC_MAX_STRING_LEN/(length+2);
199
200            GBS_strstruct out(50000);
201            bool          first = true;
202
203            while (amount && !error) {
204                int this_amount = std::min(amount, amount_per_call);
205
206                aisc_put(pd_gl.link, PT_PEP, pep,
207                         PEP_NUMGET,      (long)this_amount,
208                         PEP_FIND_PROBES, (long)0,
209                         NULL);
210
211                char *pep_result = 0;
212                if (aisc_get(pd_gl.link, PT_PEP, pep,
213                             PEP_RESULT, &pep_result,
214                             NULL)) {
215                    error = "Connection to PT_SERVER lost (2)";
216                }
217
218                if (!error) {
219                    if (pep_result[0]) {
220                        if (first) first = false;
221                        else out.put(P.ITERATE_SEPARATOR[0]);
222
223                        out.cat(pep_result);
224                        amount -= this_amount;
225                    }
226                    else {
227                        amount = 0; // terminate loop
228                    }
229                }
230                free(pep_result);
231            }
232
233            if (!error) {
234                result = out.release();
235            }
236        }
237    }
238
239    if (error) freenull(result);
240    return result;
241}
242
243static char *AP_probe_design_event(ARB_ERROR& error) {
244    PTserverConnection contact(error);
245
246    if (!error) {
247        bytestring bs;
248        bs.data = (char*)(P.DESIGNNAMES);
249        bs.size = strlen(bs.data)+1;
250
251        T_PT_PDC pdc;
252        if (aisc_create(pd_gl.link, PT_LOCS, pd_gl.locs,
253                        LOCS_PROBE_DESIGN_CONFIG, PT_PDC, pdc,
254                        PDC_MIN_PROBELEN, (long)P.DESIGNPROBELEN,
255                        PDC_MAX_PROBELEN, (long)P.DESIGNMAXPROBELEN,
256                        PDC_MINTEMP,      (double)P.MINTEMP,
257                        PDC_MAXTEMP,      (double)P.MAXTEMP,
258                        PDC_MINGC,        (double)P.MINGC/100.0,
259                        PDC_MAXGC,        (double)P.MAXGC/100.0,
260                        PDC_MAXBOND,      (double)P.MAXBOND,
261                        PDC_MIN_ECOLIPOS, (long)P.MINPOS,
262                        PDC_MAX_ECOLIPOS, (long)P.MAXPOS,
263                        PDC_MISHIT,       (long)P.MISHIT,
264                        PDC_MINTARGETS,   (double)P.MINTARGETS/100.0,
265                        PDC_CLIPRESULT,   (long)P.DESIGNCLIPOUTPUT,
266                        NULL))
267        {
268            error = "Connection to PT_SERVER lost (1)";
269        }
270
271        if (!error) {
272            for (apd_sequence *s = P.sequence; s; ) {
273                apd_sequence *next = s->next;
274
275                bytestring    bs_seq;
276                T_PT_SEQUENCE pts;
277
278                bs_seq.data = (char*)s->sequence;
279                bs_seq.size = strlen(bs_seq.data)+1;
280                aisc_create(pd_gl.link, PT_PDC, pdc,
281                            PDC_SEQUENCE, PT_SEQUENCE, pts,
282                            SEQUENCE_SEQUENCE, &bs_seq,
283                            NULL);
284
285                delete s;
286                s = next;
287            }
288
289            aisc_put(pd_gl.link, PT_PDC, pdc,
290                     PDC_NAMES, &bs,
291                     PDC_GO, (long)0,
292                     NULL);
293
294            {
295                char *locs_error = 0;
296                if (aisc_get(pd_gl.link, PT_LOCS, pd_gl.locs,
297                             LOCS_ERROR, &locs_error,
298                             NULL)) {
299                    error = "Connection to PT_SERVER lost (2)";
300                }
301                else {
302                    if (*locs_error) error = GBS_static_string(locs_error);
303                    free(locs_error);
304                }
305            }
306
307            if (!error) {
308                T_PT_TPROBE tprobe;
309                aisc_get(pd_gl.link, PT_PDC, pdc,
310                         PDC_TPROBE, tprobe.as_result_param(),
311                         NULL);
312
313
314                GBS_strstruct *outstr = GBS_stropen(1000);
315
316                if (tprobe.exists()) {
317                    char *match_info = 0;
318                    aisc_get(pd_gl.link, PT_PDC, pdc,
319                             PDC_INFO_HEADER, &match_info,
320                             NULL);
321                    GBS_strcat(outstr, match_info);
322                    GBS_chrcat(outstr, '\n');
323                    free(match_info);
324                }
325
326
327                while (tprobe.exists()) {
328                    char *match_info = 0;
329                    if (aisc_get(pd_gl.link, PT_TPROBE, tprobe,
330                                 TPROBE_NEXT, tprobe.as_result_param(),
331                                 TPROBE_INFO, &match_info,
332                                 NULL)) break;
333                    GBS_strcat(outstr, match_info);
334                    GBS_chrcat(outstr, '\n');
335                    free(match_info);
336                }
337
338                return GBS_strclose(outstr);
339            }
340        }
341    }
342    return NULL;
343}
344
345static char *AP_probe_match_event(ARB_ERROR& error) {
346    PTserverConnection contact(error);
347
348    if (!error &&
349        aisc_nput(pd_gl.link, PT_LOCS, pd_gl.locs,
350                  LOCS_MATCH_REVERSED,       (long)P.COMPLEMENT,
351                  LOCS_MATCH_SORT_BY,        (long)P.WEIGHTED,
352                  LOCS_MATCH_COMPLEMENT,     (long)0,
353                  LOCS_MATCH_MAX_MISMATCHES, (long)P.MISMATCHES,
354                  LOCS_MATCH_N_ACCEPT,       (long)P.ACCEPTN,
355                  LOCS_MATCH_N_LIMIT,        (long)P.LIMITN,
356                  LOCS_MATCH_MAX_HITS,       (long)P.MAXRESULT,
357                  LOCS_SEARCHMATCH,          P.SEQUENCE,
358                  NULL)) {
359        error = "Connection to PT_SERVER lost (1)";
360    }
361
362    if (!error) {
363        bytestring bs;
364        bs.data = 0;
365        {
366            char           *locs_error = 0;
367            T_PT_MATCHLIST  match_list;
368            long            match_list_cnt;
369
370            aisc_get(pd_gl.link, PT_LOCS, pd_gl.locs,
371                     LOCS_MATCH_LIST,     match_list.as_result_param(),
372                     LOCS_MATCH_LIST_CNT, &match_list_cnt,
373                     LOCS_MATCH_STRING,   &bs,
374                     LOCS_ERROR,          &locs_error,
375                     NULL);
376            if (*locs_error) error = GBS_static_string(locs_error);
377            free(locs_error);
378        }
379
380        if (!error) return bs.data; // freed by caller
381        free(bs.data);
382    }
383    return NULL;
384}
385
386static int          pargc;
387static const char **pargv = NULL;
388static bool         showhelp;
389static bool         outOfRange;
390
391static int getInt(const char *param, int val, int min, int max, const char *description) {
392    if (showhelp) {
393        printf("    %s=%i [%i .. ", param, val, min);
394        if (max != INT_MAX) printf("%i", max);
395        printf("] %s\n", description);
396        return 0;
397    }
398    int         i;
399    const char *s = 0;
400
401    arb_assert(min<=val && val<=max); // wrong default value
402
403    arb_assert(pargc >= 1);     // otherwise s stays 0
404
405    for (i=1; i<pargc; i++) {
406        s = pargv[i];
407        if (*s == '-') s++;
408        if (!strncasecmp(s, param, strlen(param))) break;
409    }
410    if (i==pargc) return val;
411    s   += strlen(param);
412    if (*s == '=') {
413        s++;
414        val  = atoi(s);
415
416        if (val<min || val>max) {
417            outOfRange = true;
418            printf("Parameter '%s=%s' is outside allowed range:\n", param, s);
419            showhelp   = true;
420            getInt(param, val, min, max, description);
421            showhelp   = false;
422            val        = 0;
423        }
424    }
425
426    pargc--;        // remove parameter
427    for (; i<pargc; i++) {
428        pargv[i] = pargv[i+1];
429    }
430
431    return val;
432}
433
434static const char *getString(const char *param, const char *val, const char *description) {
435    if (showhelp) {
436        if (!val) val = "";
437        printf("    %s=%s   %s\n", param, val, description);
438        return 0;
439    }
440    int   i;
441    const char *s = 0;
442
443    arb_assert(pargc >= 1);     // otherwise s stays 0
444
445    for (i=1; i<pargc; i++) {
446        s = pargv[i];
447        if (*s == '-') s++;
448        if (!strncasecmp(s, param, strlen(param))) break;
449    }
450    if (i==pargc) return val;
451    s += strlen(param);
452    if (*s != '=') return val;
453    s++;
454    pargc--;        // remove parameter
455    for (; i<pargc; i++) {
456        pargv[i] = pargv[i+1];
457    }
458    return s;
459}
460
461static bool parseCommandLine(int argc, const char * const * const argv) {
462    pargc = argc;
463
464    // copy argv (since parser will remove matched arguments)
465    free(pargv);
466    ARB_alloc(pargv, pargc);
467    for (int i=0; i<pargc; i++) pargv[i] = argv[i];
468
469    showhelp   = (pargc <= 1);
470    outOfRange = false;
471
472#ifdef UNIT_TESTS // UT_DIFF
473    const int minServerID   = TEST_GENESERVER_ID;
474#else // !UNIT_TESTS
475    const int minServerID   = 0;
476#endif
477
478    P.SERVERID = getInt("serverid", 0, minServerID, 100, "Server Id, look into $ARBHOME/lib/arb_tcp.dat");
479#ifdef UNIT_TESTS // UT_DIFF
480    if (P.SERVERID<0) { arb_assert(P.SERVERID == TEST_SERVER_ID || P.SERVERID == TEST_GENESERVER_ID); }
481#endif
482
483    P.DESIGNCLIPOUTPUT = getInt("designmaxhits", 100, 10, 10000, "Maximum Number of Probe Design Suggestions");
484    P.DESIGNNAMES      = getString("designnames", "",            "List of short names separated by '#'");
485
486    P.sequence = 0;
487    while  ((P.DESIGNSEQUENCE = getString("designsequence", 0, "Additional Sequences, will be added to the target group"))) {
488        apd_sequence *= new apd_sequence;
489        s->next          = P.sequence;
490        P.sequence       = s;
491        s->sequence      = P.DESIGNSEQUENCE;
492        P.DESIGNSEQUENCE = 0;
493    }
494    P.DESIGNPROBELEN    = getInt("designprobelength",    18,  2,  100,     "(min.) length of probe");
495    P.DESIGNMAXPROBELEN = getInt("designmaxprobelength", -1,  -1, 100,     "max. length of probe (if specified)");
496    P.MINTEMP           = getInt("designmintemp",        0,   0,  400,     "Minimum melting temperature of probe");
497    P.MAXTEMP           = getInt("designmaxtemp",        400, 0,  400,     "Maximum melting temperature of probe");
498    P.MINGC             = getInt("designmingc",          30,  0,  100,     "Minimum gc content");
499    P.MAXGC             = getInt("designmaxgc",          80,  0,  100,     "Maximum gc content");
500    P.MAXBOND           = getInt("designmaxbond",        0,   0,  10,      "Not implemented");
501    P.MINPOS            = getInt("designminpos",         -1,  -1, INT_MAX, "Minimum ecoli position (-1=none)");
502    P.MAXPOS            = getInt("designmaxpos",         -1,  -1, INT_MAX, "Maximum ecoli position (-1=none)");
503    P.MISHIT            = getInt("designmishit",         0,   0,  10000,   "Number of allowed hits outside the selected group");
504    P.MINTARGETS        = getInt("designmintargets",     50,  0,  100,     "Minimum percentage of hits within the selected species");
505
506    P.SEQUENCE = getString("matchsequence",   "agtagtagt", "The sequence to search for");
507
508    P.MISMATCHES = getInt("matchmismatches", 0,       0, INT_MAX, "Maximum Number of allowed mismatches");
509    P.COMPLEMENT = getInt("matchcomplement", 0,       0, 1,       "Match reversed and complemented probe");
510    P.WEIGHTED   = getInt("matchweighted",   0,       0, 1,       "Use weighted mismatches");
511    P.ACCEPTN    = getInt("matchacceptN",    1,       0, INT_MAX, "Amount of N-matches not counted as mismatch");
512    P.LIMITN     = getInt("matchlimitN",     4,       0, INT_MAX, "Limit for N-matches. If reached N-matches are mismatches");
513    P.MAXRESULT  = getInt("matchmaxresults", 1000000, 0, INT_MAX, "Max. number of matches reported (0=unlimited)");
514
515    P.ITERATE          = getInt("iterate",          0,   0, 20,      "Iterate over probes of given length");
516    P.ITERATE_AMOUNT   = getInt("iterate_amount",   100, 1, INT_MAX, "Number of results per answer");
517    P.ITERATE_READABLE = getInt("iterate_readable", 1,   0, 1,       "readable results");
518
519    P.ITERATE_TU        = getString("iterate_tu",        "T", "use T or U in readable result");
520    P.ITERATE_SEPARATOR = getString("iterate_separator", ";", "Number of results per answer");
521
522    P.DUMP = getString("dump", "", "dump ptserver index to file (may be huge!)");
523
524    if (pargc>1) {
525        printf("Unknown (or duplicate) parameter %s\n", pargv[1]);
526        return false;
527    }
528    if (outOfRange) {
529        puts("Not all parameters were inside allowed range\n");
530        return false;
531    }
532
533    return !showhelp;
534}
535
536// --------------------------------------------------------------------------------
537
538#ifdef UNIT_TESTS
539#ifndef TEST_UNIT_H
540#include <test_unit.h>
541#endif
542
543void TEST_BASIC_parseCommandLine() {
544    {
545        const char *args[] = { NULL, "serverid=0"};
546        TEST_EXPECT(parseCommandLine(ARRAY_ELEMS(args), args));
547
548        // test default values here
549        TEST_EXPECT_EQUAL(P.ACCEPTN, 1);
550        TEST_EXPECT_EQUAL(P.LIMITN, 4);
551        TEST_EXPECT_EQUAL(P.MISMATCHES, 0);
552        TEST_EXPECT_EQUAL(P.MAXRESULT, 1000000);
553    }
554
555    {
556        const char *args[] = {NULL, "serverid=4", "matchmismatches=2"};
557        TEST_EXPECT(parseCommandLine(ARRAY_ELEMS(args), args));
558        TEST_EXPECT_EQUAL(P.SERVERID, 4);
559        TEST_EXPECT_EQUAL(P.MISMATCHES, 2);
560        TEST_EXPECT_EQUAL(args[1], "serverid=4"); // check array args was not modified
561    }
562
563    {
564        const char *args[] = { NULL, "matchacceptN=0", "matchlimitN=5"};
565        TEST_EXPECT(parseCommandLine(ARRAY_ELEMS(args), args));
566        TEST_EXPECT_EQUAL(P.ACCEPTN, 0);
567        TEST_EXPECT_EQUAL(P.LIMITN, 5);
568    }
569
570    {
571        const char *args[] = { NULL, "matchmaxresults=100"};
572        TEST_EXPECT(parseCommandLine(ARRAY_ELEMS(args), args));
573        TEST_EXPECT_EQUAL(P.MAXRESULT, 100);
574    }
575}
576
577#endif // UNIT_TESTS
578
579// --------------------------------------------------------------------------------
580
581
582static char *execute(ARB_ERROR& error) {
583    char *answer;
584    if (*P.DESIGNNAMES || P.sequence) {
585        answer = AP_probe_design_event(error);
586    }
587    else if (P.ITERATE>0) {
588        answer = AP_probe_iterate_event(error);
589    }
590    else if (P.DUMP[0]) {
591        answer = AP_dump_index_event(error);
592    }
593    else {
594        answer = AP_probe_match_event(error);
595    }
596    pd_gl.locs.clear();
597    return answer;
598}
599
600int ARB_main(int argc, char *argv[]) {
601    bool ok = parseCommandLine(argc, argv);
602    if (ok) {
603        ARB_ERROR  error;
604        char      *answer = execute(error);
605
606        arb_assert(contradicted(answer, error));
607
608        if (!answer) {
609            fprintf(stderr,
610                    "arb_probe: Failed to process your request\n"
611                    "           Reason: %s",
612                    error.deliver());
613            ok = false;
614        }
615        else {
616            fputs(answer, stdout);
617            free(answer);
618            error.expect_no_error();
619        }
620    }
621    return ok ? EXIT_SUCCESS : EXIT_FAILURE;
622}
623
624// --------------------------------------------------------------------------------
625
626#ifdef UNIT_TESTS
627#ifndef TEST_UNIT_H
628#include <test_unit.h>
629#endif
630
631static int test_setup(bool use_gene_ptserver) {
632    static bool setup[2] = { false, false };
633    if (!setup[use_gene_ptserver]) {
634        TEST_SETUP_GLOBAL_ENVIRONMENT(use_gene_ptserver ? "ptserver_gene" : "ptserver"); // first call will recreate the test pt-server
635        setup[use_gene_ptserver] = true;
636    }
637    return use_gene_ptserver ? TEST_GENESERVER_ID : TEST_SERVER_ID;
638}
639
640// ----------------------------------
641//      test probe design / match
642
643#define TEST_RUN_ARB_PROBE__INT(fake_argc,fake_argv)                                    \
644    int serverid = test_setup(use_gene_ptserver);                                       \
645    TEST_EXPECT_EQUAL(true, parseCommandLine(fake_argc, fake_argv));                    \
646    TEST_EXPECT((serverid == TEST_SERVER_ID)||(serverid == TEST_GENESERVER_ID));        \
647    P.SERVERID = serverid;                                                              \
648    ARB_ERROR error;                                                                    \
649    char *answer = execute(error)
650
651#define TEST_ARB_PROBE__REPORTS_ERROR(fake_argc,fake_argv,expected_error)       \
652    TEST_RUN_ARB_PROBE__INT(fake_argc,fake_argv);                               \
653    free(answer);                                                               \
654    TEST_EXPECT_ERROR_CONTAINS(error.deliver(), expected_error)
655
656#define TEST_ARB_PROBE__REPORTS_ERROR__BROKEN(fake_argc,fake_argv,expected_error)       \
657    TEST_RUN_ARB_PROBE__INT(fake_argc,fake_argv);                                       \
658    free(answer);                                                                       \
659    TEST_EXPECT_ANY_ERROR(error.preserve());                                            \
660    TEST_EXPECT_ERROR_CONTAINS__BROKEN(error.deliver(), expected_error)
661
662
663#define TEST_RUN_ARB_PROBE(fake_argc,fake_argv)                 \
664    TEST_RUN_ARB_PROBE__INT(fake_argc,fake_argv);               \
665    TEST_EXPECT_NO_ERROR(error.deliver())
666
667#define TEST_ARB_PROBE(fake_argc,fake_argv,expected) do {       \
668        TEST_RUN_ARB_PROBE(fake_argc,fake_argv);                \
669        TEST_EXPECT_EQUAL(answer, expected);                    \
670        free(answer);                                           \
671    } while(0)
672
673#define TEST_ARB_PROBE__BROKEN(fake_argc,fake_argv,expected) do {       \
674        TEST_RUN_ARB_PROBE(fake_argc,fake_argv);                        \
675        TEST_EXPECT_EQUAL__BROKEN(answer, expected);                    \
676        free(answer);                                                   \
677    } while(0)
678
679#define TEST_ARB_PROBE_FILT(fake_argc,fake_argv,filter,expected) do {   \
680        TEST_RUN_ARB_PROBE(fake_argc,fake_argv);                        \
681        char  *filtered   = filter(answer);                             \
682        TEST_EXPECT_EQUAL(filtered, expected);                          \
683        free(filtered);                                                 \
684        free(answer);                                                   \
685    } while(0)
686
687typedef const char *CCP;
688
689void TEST_SLOW_match_geneprobe() {
690    // test here runs versus database ../UNIT_TESTER/run/TEST_gpt_src.arb
691
692    bool use_gene_ptserver = true;
693    {
694        const char *arguments[] = {
695            "prgnamefake",
696            "matchsequence=NNUCNN",
697            "matchacceptN=4",
698            "matchlimitN=5",
699        };
700        CCP expectd = "    organism genename------- mis N_mis wmis pos gpos rev          'NNUCNN'\1"
701            "genome2\1" "  genome2  gene3             0     4  2.6   2    1 0   .........-UU==GG-UUGAUC.\1"
702            "genome2\1" "  genome2  joined1           0     4  2.6   2    1 0   .........-UU==GG-UUGAUCCUG\1"
703            "genome2\1" "  genome2  gene1             0     4  2.6   2    2 0   ........A-UU==GG-U.\1"
704            "genome2\1" "  genome2  intergene_19_65   0     4  2.7  31   12 0   GGUUACUGC-AU==GG-UGUUCGCCU\1"
705            "genome1\1" "  genome1  intergene_17_65   0     4  2.7  31   14 0   GGUUACUGC-UA==GG-UGUUCGCCU\1"
706            "genome2\1" "  genome2  intergene_19_65   0     4  2.7  38   19 0   GCAUUCGGU-GU==GC-CUAAGCACU\1"
707            "genome1\1" "  genome1  intergene_17_65   0     4  2.7  38   21 0   GCUAUCGGU-GU==GC-CUAAGCCAU\1"
708            "genome2\1" "  genome2  gene3             0     4  2.9  10    9 0   .UUUCGGUU-GA==..-\1"
709            "genome2\1" "  genome2  intergene_19_65   0     4  3.1  56   37 0   AGCACUGCG-AG==AU-AUGUA.\1"
710            "genome1\1" "  genome1  intergene_17_65   0     4  3.1  56   39 0   AGCCAUGCG-AG==AU-AUGUA.\1"
711            "genome1\1" "  genome1  gene2             0     4  3.1  10    2 0   ........U-GA==CU-GC.\1"
712            "genome2\1" "  genome2  gene2             0     4  3.1  10    4 0   ......GUU-GA==CU-GCCA.\1"
713            "genome1\1" "  genome1  joined1           0     4  3.1  10    7 0   ...CUGGUU-GA==CU-GC.\1"
714            "genome2\1" "  genome2  joined1           0     4  3.1  10    9 0   .UUUCGGUU-GA==CU-GCCA.\1";
715
716        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd);
717    }
718
719    {
720        const char *arguments[] = {
721            "prgnamefake",
722            "matchsequence=NGGUUN",
723            "matchacceptN=2",
724            "matchlimitN=3",
725        };
726        CCP expectd = "    organism genename------- mis N_mis wmis pos gpos rev          'NGGUUN'\1"
727            "genome1\1" "  genome1  gene3             0     2  1.3   5    2 0   ........C-U====G-A.\1"
728            "genome1\1" "  genome1  joined1           0     2  1.3   5    2 0   ........C-U====G-AUCCUGC.\1"
729            "genome2\1" "  genome2  gene3             0     2  1.4   5    4 0   ......UUU-C====G-AUC.\1"
730            "genome2\1" "  genome2  joined1           0     2  1.4   5    4 0   ......UUU-C====G-AUCCUGCCA\1"
731            "genome2\1" "  genome2  intergene_19_65   0     2  1.8  21    2 0   ........G-A====A-CUGCAUUCG\1"
732            "genome1\1" "  genome1  intergene_17_65   0     2  1.8  21    4 0   ......CAG-A====A-CUGCUAUCG\1";
733
734        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd);
735    }
736
737    {
738        const char *arguments[] = {
739            "prgnamefake",
740            "matchsequence=UGAUCCU", // exists in data
741        };
742        CCP expectd = "    organism genename mis N_mis wmis pos gpos rev          'UGAUCCU'\1"
743            "genome1\1" "  genome1  gene2      0     0  0.0   9    1 0   .........-=======-GC.\1"
744            "genome2\1" "  genome2  gene2      0     0  0.0   9    3 0   .......GU-=======-GCCA.\1"
745            "genome1\1" "  genome1  joined1    0     0  0.0   9    6 0   ....CUGGU-=======-GC.\1"
746            "genome2\1" "  genome2  joined1    0     0  0.0   9    8 0   ..UUUCGGU-=======-GCCA.\1";
747
748        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd); // [fixed: now reports hits in  'joined1' (of both genomes)]
749    }
750    {
751        const char *arguments[] = {
752            "prgnamefake",
753            "matchsequence=GAUCCU",
754        };
755        CCP expectd = "    organism genename mis N_mis wmis pos gpos rev          'GAUCCU'\1"
756            "genome1\1" "  genome1  gene2      0     0  0.0  10    2 0   ........U-======-GC.\1"
757            "genome2\1" "  genome2  gene2      0     0  0.0  10    4 0   ......GUU-======-GCCA.\1"
758            "genome1\1" "  genome1  joined1    0     0  0.0  10    7 0   ...CUGGUU-======-GC.\1"
759            "genome2\1" "  genome2  joined1    0     0  0.0  10    9 0   .UUUCGGUU-======-GCCA.\1";
760
761        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd); // [fixed: now reports as much hits as previous test; expected cause probe is part of above probe]
762    }
763    {
764        const char *arguments[] = {
765            "prgnamefake",
766            "matchsequence=UUUCGG", // exists only in genome2
767        };
768        CCP expectd = "    organism genename mis N_mis wmis pos gpos rev          'UUUCGG'\1"
769            "genome2\1" "  genome2  gene3      0     0  0.0   2    1 0   .........-======-UUGAUC.\1"
770            "genome2\1" "  genome2  joined1    0     0  0.0   2    1 0   .........-======-UUGAUCCUG\1"
771            "genome2\1" "  genome2  gene1      0     0  0.0   2    2 0   ........A-======-U.\1";
772
773        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd); // [fixed: now reports hit in genome2/gene1]
774    }
775    {
776        const char *arguments[] = {
777            "prgnamefake",
778            "matchsequence=AUCCUG",
779        };
780        CCP expectd = "    organism genename mis N_mis wmis pos gpos rev          'AUCCUG'\1"
781            "genome1\1" "  genome1  gene2      0     0  0.0  11    3 0   .......UG-======-C.\1"
782            "genome2\1" "  genome2  gene2      0     0  0.0  11    5 0   .....GUUG-======-CCA.\1"
783            "genome1\1" "  genome1  joined1    0     0  0.0  11    8 0   ..CUGGUUG-======-C.\1"
784            "genome2\1" "  genome2  joined1    0     0  0.0  11   10 0   UUUCGGUUG-======-CCA.\1";
785
786        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd); // [fixed: now reports hits in 'gene2' and 'joined1' of both genomes]
787    }
788    {
789        const char *arguments[] = {
790            "prgnamefake",
791            "matchsequence=UUGAUCCUGC",
792        };
793        CCP expectd = "    organism genename mis N_mis wmis pos gpos rev          'UUGAUCCUGC'\1"
794            "genome2\1" "  genome2  gene2      0     0  0.0   8    2 0   ........G-==========-CA.\1"
795            "genome1\1" "  genome1  joined1    0     0  0.0   8    5 0   .....CUGG-==========-.\1"
796            "genome2\1" "  genome2  joined1    0     0  0.0   8    7 0   ...UUUCGG-==========-CA.\1";
797
798        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd); // [fixed: now reports hit in 'genome2/joined1']
799    }
800}
801
802void TEST_SLOW_match_probe() {
803    // test here runs versus database ../UNIT_TESTER/run/TEST_pt_src.arb
804
805    bool use_gene_ptserver = false;
806    {
807        const char *arguments[] = {
808            "prgnamefake",
809            "matchsequence=UAUCGGAGAGUUUGA",
810        };
811        CCP expected = "    name---- fullname mis N_mis wmis pos ecoli rev          'UAUCGGAGAGUUUGA'\1"
812            "BcSSSS00\1" "  BcSSSS00            0     0  0.0   3     2 0   .......UU-===============-UCAAGUCGA\1";
813
814        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
815    }
816
817    // ----------------------------------------------------------------------------
818    //      match with old(=default) N-mismatch-behavior (accepting 1 N-match)
819
820    {
821        const char *arguments[] = {
822            "prgnamefake",
823            "matchsequence=CANCUCCUUUC", // contains 1 N
824            NULL // matchmismatches
825        };
826
827        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUUC'\1"
828            "BcSSSS00\1" "  BcSSSS00            0     1  0.9 176   162 0   CGGCUGGAU-==C========-U.\1"; // only N-mismatch accepted
829
830        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUUC'\1"
831            "BcSSSS00\1" "  BcSSSS00            0     1  0.9 176   162 0   CGGCUGGAU-==C========-U.\1"
832            "ClfPerfr\1" "  ClfPerfr            1     1  2.0 176   162 0   AGAUUAAUA-=CC========-U.\1"
833            "PbcAcet2\1" "  PbcAcet2            1     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
834            "PbrPropi\1" "  PbrPropi            1     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
835            "Stsssola\1" "  Stsssola            1     2  1.6 176   162 0   CGGCUGGAU-==C=======.-\1"
836            "DcdNodos\1" "  DcdNodos            1     2  1.6 176   162 0   CGGUUGGAU-==C=======.-\1"
837            "VbrFurni\1" "  VbrFurni            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
838            "VblVulni\1" "  VblVulni            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
839            "VbhChole\1" "  VbhChole            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1";
840
841        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUUC'\1"
842            "BcSSSS00\1" "  BcSSSS00            0     1  0.9 176   162 0   CGGCUGGAU-==C========-U.\1"
843            "ClfPerfr\1" "  ClfPerfr            1     1  2.0 176   162 0   AGAUUAAUA-=CC========-U.\1"
844            "PbcAcet2\1" "  PbcAcet2            1     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
845            "PbrPropi\1" "  PbrPropi            1     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
846            "Stsssola\1" "  Stsssola            1     2  1.6 176   162 0   CGGCUGGAU-==C=======.-\1"
847            "DcdNodos\1" "  DcdNodos            1     2  1.6 176   162 0   CGGUUGGAU-==C=======.-\1"
848            "VbrFurni\1" "  VbrFurni            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
849            "VblVulni\1" "  VblVulni            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
850            "VbhChole\1" "  VbhChole            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
851            "AclPleur\1" "  AclPleur            2     2  2.7 176   162 0   CGGUUGGAU-==C======A.-\1"
852            "PtVVVulg\1" "  PtVVVulg            2     2  2.7 176   162 0   CGGUUGGAU-==C======A.-\1"
853            "DlcTolu2\1" "  DlcTolu2            2     3  2.3 176   162 0   CGGCUGGAU-==C======NN-N.\1"
854            "FrhhPhil\1" "  FrhhPhil            2     3  2.3 176   162 0   CGGCUGGAU-==C======..-\1"
855            "HllHalod\1" "  HllHalod            2     3  2.3 176   162 0   CGGCUGGAU-==C======..-\1"
856            "CPPParap\1" "  CPPParap            2     3  2.3 177   163 0   CGGNUGGAU-==C======..-\1";
857
858        CCP expectd3 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUUC'\1"
859            "BcSSSS00\1" "  BcSSSS00            0     1  0.9 176   162 0   CGGCUGGAU-==C========-U.\1"
860            "ClfPerfr\1" "  ClfPerfr            1     1  2.0 176   162 0   AGAUUAAUA-=CC========-U.\1"
861            "PbcAcet2\1" "  PbcAcet2            1     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
862            "PbrPropi\1" "  PbrPropi            1     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
863            "Stsssola\1" "  Stsssola            1     2  1.6 176   162 0   CGGCUGGAU-==C=======.-\1"
864            "DcdNodos\1" "  DcdNodos            1     2  1.6 176   162 0   CGGUUGGAU-==C=======.-\1"
865            "VbrFurni\1" "  VbrFurni            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
866            "VblVulni\1" "  VblVulni            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
867            "VbhChole\1" "  VbhChole            1     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
868            "AclPleur\1" "  AclPleur            2     2  2.7 176   162 0   CGGUUGGAU-==C======A.-\1"
869            "PtVVVulg\1" "  PtVVVulg            2     2  2.7 176   162 0   CGGUUGGAU-==C======A.-\1"
870            "DlcTolu2\1" "  DlcTolu2            2     3  2.3 176   162 0   CGGCUGGAU-==C======NN-N.\1"
871            "FrhhPhil\1" "  FrhhPhil            2     3  2.3 176   162 0   CGGCUGGAU-==C======..-\1"
872            "HllHalod\1" "  HllHalod            2     3  2.3 176   162 0   CGGCUGGAU-==C======..-\1"
873            "CPPParap\1" "  CPPParap            2     3  2.3 177   163 0   CGGNUGGAU-==C======..-\1"
874            "VblVulni\1" "  VblVulni            3     1  3.6  49    44 0   AGCACAGAG-a=A==uG====-UCGGGUGGC\1";
875
876        arguments[2] = "matchmismatches=0";  TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
877        arguments[2] = "matchmismatches=1";  TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
878        arguments[2] = "matchmismatches=2";  TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
879        arguments[2] = "matchmismatches=3";  TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd3);
880    }
881
882    {
883        const char *arguments[] = {
884            "prgnamefake",
885            "matchsequence=UCACCUCCUUUC", // contains no N
886            NULL // matchmismatches
887        };
888
889        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
890            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
891            "PbcAcet2\1" "  PbcAcet2            0     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
892            "PbrPropi\1" "  PbrPropi            0     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
893            "Stsssola\1" "  Stsssola            0     1  0.7 175   161 0   GCGGCUGGA-===========.-\1"
894            "DcdNodos\1" "  DcdNodos            0     1  0.7 175   161 0   GCGGUUGGA-===========.-\1"
895            "VbrFurni\1" "  VbrFurni            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
896            "VblVulni\1" "  VblVulni            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
897            "VbhChole\1" "  VbhChole            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1";
898
899        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
900            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
901            "PbcAcet2\1" "  PbcAcet2            0     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
902            "PbrPropi\1" "  PbrPropi            0     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
903            "Stsssola\1" "  Stsssola            0     1  0.7 175   161 0   GCGGCUGGA-===========.-\1"
904            "DcdNodos\1" "  DcdNodos            0     1  0.7 175   161 0   GCGGUUGGA-===========.-\1"
905            "VbrFurni\1" "  VbrFurni            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
906            "VblVulni\1" "  VblVulni            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
907            "VbhChole\1" "  VbhChole            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
908            "AclPleur\1" "  AclPleur            1     1  1.8 175   161 0   GCGGUUGGA-==========A.-\1"
909            "PtVVVulg\1" "  PtVVVulg            1     1  1.8 175   161 0   GCGGUUGGA-==========A.-\1"
910            "DlcTolu2\1" "  DlcTolu2            1     2  1.4 175   161 0   GCGGCUGGA-==========NN-N.\1"
911            "FrhhPhil\1" "  FrhhPhil            1     2  1.4 175   161 0   GCGGCUGGA-==========..-\1"
912            "HllHalod\1" "  HllHalod            1     2  1.4 175   161 0   GCGGCUGGA-==========..-\1"
913            "CPPParap\1" "  CPPParap            1     2  1.4 176   162 0   GCGGNUGGA-==========..-\1";
914
915        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
916            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
917            "PbcAcet2\1" "  PbcAcet2            0     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
918            "PbrPropi\1" "  PbrPropi            0     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
919            "Stsssola\1" "  Stsssola            0     1  0.7 175   161 0   GCGGCUGGA-===========.-\1"
920            "DcdNodos\1" "  DcdNodos            0     1  0.7 175   161 0   GCGGUUGGA-===========.-\1"
921            "VbrFurni\1" "  VbrFurni            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
922            "VblVulni\1" "  VblVulni            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
923            "VbhChole\1" "  VbhChole            0     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
924            "AclPleur\1" "  AclPleur            1     1  1.8 175   161 0   GCGGUUGGA-==========A.-\1"
925            "PtVVVulg\1" "  PtVVVulg            1     1  1.8 175   161 0   GCGGUUGGA-==========A.-\1"
926            "DlcTolu2\1" "  DlcTolu2            1     2  1.4 175   161 0   GCGGCUGGA-==========NN-N.\1"
927            "FrhhPhil\1" "  FrhhPhil            1     2  1.4 175   161 0   GCGGCUGGA-==========..-\1"
928            "HllHalod\1" "  HllHalod            1     2  1.4 175   161 0   GCGGCUGGA-==========..-\1"
929            "CPPParap\1" "  CPPParap            1     2  1.4 176   162 0   GCGGNUGGA-==========..-\1"
930            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 175   161 0   AAGAUUAAU-A=C=========-U.\1"
931            "LgtLytic\1" "  LgtLytic            2     3  2.1 175   161 0   GCGGCUGGA-=========N..-\1"
932            "PslFlave\1" "  PslFlave            2     3  2.1 175   161 0   GCGGCUGGA-=========...-\1";
933
934        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
935        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
936        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
937    }
938
939    {
940        const char *arguments[] = {
941            "prgnamefake",
942            "matchsequence=UCACCUCCUUUC", // contains no N
943            NULL,                         // matchmismatches
944            "matchweighted=1",            // use weighted mismatches
945        };
946
947        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
948            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
949            "PbcAcet2\1" "  PbcAcet2            0     1  0.2 175   161 0   GCGGCUGGA-===========N-N.\1"
950            "PbrPropi\1" "  PbrPropi            0     1  0.2 175   161 0   GCGGCUGGA-===========N-N.\1"
951            "Stsssola\1" "  Stsssola            0     1  0.2 175   161 0   GCGGCUGGA-===========.-\1"
952            "DcdNodos\1" "  DcdNodos            0     1  0.2 175   161 0   GCGGUUGGA-===========.-\1"
953            "VbrFurni\1" "  VbrFurni            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
954            "VblVulni\1" "  VblVulni            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
955            "VbhChole\1" "  VbhChole            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1";
956
957        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
958            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
959            "PbcAcet2\1" "  PbcAcet2            0     1  0.2 175   161 0   GCGGCUGGA-===========N-N.\1"
960            "PbrPropi\1" "  PbrPropi            0     1  0.2 175   161 0   GCGGCUGGA-===========N-N.\1"
961            "Stsssola\1" "  Stsssola            0     1  0.2 175   161 0   GCGGCUGGA-===========.-\1"
962            "DcdNodos\1" "  DcdNodos            0     1  0.2 175   161 0   GCGGUUGGA-===========.-\1"
963            "VbrFurni\1" "  VbrFurni            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
964            "VblVulni\1" "  VblVulni            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
965            "VbhChole\1" "  VbhChole            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
966            "DlcTolu2\1" "  DlcTolu2            1     2  0.6 175   161 0   GCGGCUGGA-==========NN-N.\1"
967            "FrhhPhil\1" "  FrhhPhil            1     2  0.6 175   161 0   GCGGCUGGA-==========..-\1"
968            "HllHalod\1" "  HllHalod            1     2  0.6 175   161 0   GCGGCUGGA-==========..-\1"
969            "CPPParap\1" "  CPPParap            1     2  0.6 176   162 0   GCGGNUGGA-==========..-\1"
970            "AclPleur\1" "  AclPleur            1     1  0.9 175   161 0   GCGGUUGGA-==========A.-\1"
971            "PtVVVulg\1" "  PtVVVulg            1     1  0.9 175   161 0   GCGGUUGGA-==========A.-\1"
972            "LgtLytic\1" "  LgtLytic            2     3  1.3 175   161 0   GCGGCUGGA-=========N..-\1"
973            "PslFlave\1" "  PslFlave            2     3  1.3 175   161 0   GCGGCUGGA-=========...-\1"
974            "ClfPerfr\1" "  ClfPerfr            2     0  1.3 175   161 0   AAGAUUAAU-A=C=========-U.\1";
975
976        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
977            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
978            "PbcAcet2\1" "  PbcAcet2            0     1  0.2 175   161 0   GCGGCUGGA-===========N-N.\1"
979            "PbrPropi\1" "  PbrPropi            0     1  0.2 175   161 0   GCGGCUGGA-===========N-N.\1"
980            "Stsssola\1" "  Stsssola            0     1  0.2 175   161 0   GCGGCUGGA-===========.-\1"
981            "DcdNodos\1" "  DcdNodos            0     1  0.2 175   161 0   GCGGUUGGA-===========.-\1"
982            "VbrFurni\1" "  VbrFurni            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
983            "VblVulni\1" "  VblVulni            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
984            "VbhChole\1" "  VbhChole            0     1  0.2 175   161 0   GGCGCUGGA-===========.-\1"
985            "DlcTolu2\1" "  DlcTolu2            1     2  0.6 175   161 0   GCGGCUGGA-==========NN-N.\1"
986            "FrhhPhil\1" "  FrhhPhil            1     2  0.6 175   161 0   GCGGCUGGA-==========..-\1"
987            "HllHalod\1" "  HllHalod            1     2  0.6 175   161 0   GCGGCUGGA-==========..-\1"
988            "CPPParap\1" "  CPPParap            1     2  0.6 176   162 0   GCGGNUGGA-==========..-\1"
989            "AclPleur\1" "  AclPleur            1     1  0.9 175   161 0   GCGGUUGGA-==========A.-\1"
990            "PtVVVulg\1" "  PtVVVulg            1     1  0.9 175   161 0   GCGGUUGGA-==========A.-\1"
991            "LgtLytic\1" "  LgtLytic            2     3  1.3 175   161 0   GCGGCUGGA-=========N..-\1"
992            "PslFlave\1" "  PslFlave            2     3  1.3 175   161 0   GCGGCUGGA-=========...-\1"
993            "ClfPerfr\1" "  ClfPerfr            2     0  1.3 175   161 0   AAGAUUAAU-A=C=========-U.\1"
994            "AclPleur\1" "  AclPleur            5     0  2.4  50    45 0   GAAGGGAGC-=ug=u=u====G-CCGACGAGU\1"
995            "PtVVVulg\1" "  PtVVVulg            5     0  2.4  50    45 0   GGAGAAAGC-=ug=u=u===g=-UGACGAGCG\1";
996
997        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
998        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
999        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1000    }
1001
1002    // ----------------------------------------------
1003    //      do not accept any N-matches as match
1004
1005    {
1006        const char *arguments[] = {
1007            "prgnamefake",
1008            "matchsequence=CANCUCCUUUC", // contains 1 N
1009            NULL, // matchmismatches
1010            "matchacceptN=0",
1011        };
1012
1013        CCP expectd0 = ""; // nothing matches
1014
1015        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUUC'\1"
1016            "BcSSSS00\1" "  BcSSSS00            1     1  0.9 176   162 0   CGGCUGGAU-==C========-U.\1";
1017
1018        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUUC'\1"
1019            "BcSSSS00\1" "  BcSSSS00            1     1  0.9 176   162 0   CGGCUGGAU-==C========-U.\1"
1020            "ClfPerfr\1" "  ClfPerfr            2     1  2.0 176   162 0   AGAUUAAUA-=CC========-U.\1"
1021            "PbcAcet2\1" "  PbcAcet2            2     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
1022            "PbrPropi\1" "  PbrPropi            2     2  1.6 176   162 0   CGGCUGGAU-==C=======N-N.\1"
1023            "Stsssola\1" "  Stsssola            2     2  1.6 176   162 0   CGGCUGGAU-==C=======.-\1"
1024            "DcdNodos\1" "  DcdNodos            2     2  1.6 176   162 0   CGGUUGGAU-==C=======.-\1"
1025            "VbrFurni\1" "  VbrFurni            2     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
1026            "VblVulni\1" "  VblVulni            2     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1"
1027            "VbhChole\1" "  VbhChole            2     2  1.6 176   162 0   GCGCUGGAU-==C=======.-\1";
1028
1029        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1030        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1031        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1032    }
1033    {
1034        const char *arguments[] = {
1035            "prgnamefake",
1036            "matchsequence=UUUCUUU", // contains no N
1037            NULL, // matchmismatches
1038            "matchacceptN=0",
1039        };
1040
1041        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UUUCUUU'\1"
1042            "AclPleur\1" "  AclPleur            0     0  0.0  54    49 0   GGAGCUUGC-=======-GCCGACGAG\1";
1043
1044        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UUUCUUU'\1"
1045            "AclPleur\1" "  AclPleur            0     0  0.0  54    49 0   GGAGCUUGC-=======-GCCGACGAG\1"
1046            "AclPleur\1" "  AclPleur            1     0  0.6  50    45 0   GAAGGGAGC-==g====-CUUUGCCGA\1"
1047            "PtVVVulg\1" "  PtVVVulg            1     0  0.6  50    45 0   GGAGAAAGC-==g====-CUUGCUGAC\1"
1048            "PtVVVulg\1" "  PtVVVulg            1     0  0.6  54    49 0   AAAGCUUGC-======g-CUGACGAGC\1"
1049            "ClfPerfr\1" "  ClfPerfr            1     0  1.1  49    44 0   GCGAUGAAG-====C==-CGGGAAACG\1";
1050
1051        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UUUCUUU'\1"
1052            "AclPleur\1" "  AclPleur            0     0  0.0  54    49 0   GGAGCUUGC-=======-GCCGACGAG\1"
1053            "AclPleur\1" "  AclPleur            1     0  0.6  50    45 0   GAAGGGAGC-==g====-CUUUGCCGA\1"
1054            "PtVVVulg\1" "  PtVVVulg            1     0  0.6  50    45 0   GGAGAAAGC-==g====-CUUGCUGAC\1"
1055            "PtVVVulg\1" "  PtVVVulg            1     0  0.6  54    49 0   AAAGCUUGC-======g-CUGACGAGC\1"
1056            "ClfPerfr\1" "  ClfPerfr            1     0  1.1  49    44 0   GCGAUGAAG-====C==-CGGGAAACG\1"
1057            "DlcTolu2\1" "  DlcTolu2            2     0  1.2  47    42 0   AGAAAGGGA-==g===g-CAAUCCUGA\1"
1058            "ClnCorin\1" "  ClnCorin            2     0  1.7  48    43 0   AGCGAUGAA-g===C==-CGGGAAUGG\1"
1059            "CPPParap\1" "  CPPParap            2     0  1.7  48    43 0   AGCGAUGAA-g===C==-CGGGAACGG\1"
1060            "HllHalod\1" "  HllHalod            2     0  1.7  49    44 0   GAUGGAAGC-==g===C-CAGGCGUCG\1"
1061            "DcdNodos\1" "  DcdNodos            2     0  1.7  50    45 0   UUAUGUAGC-==g==A=-GUAACCUAG\1"
1062            "VbhChole\1" "  VbhChole            2     0  1.7  55    50 0   GAGGAACUU-g===C==-GGGUGGCGA\1"
1063            "VbrFurni\1" "  VbrFurni            2     0  1.7  62    57 0   UUCGGGGGA-===G==g-GGCGGCGAG\1"
1064            "VblVulni\1" "  VblVulni            2     0  1.7  62    57 0   AGAAACUUG-=====Cg-GGUGGCGAG\1"
1065            "VbhChole\1" "  VbhChole            2     0  1.7  62    57 0   AGGAACUUG-==C===g-GGUGGCGAG\1"
1066            "ClnCorin\1" "  ClnCorin            2     0  2.2  49    44 0   GCGAUGAAG-==C===C-GGGAAUGGA\1"
1067            "CltBotul\1" "  CltBotul            2     0  2.2  49    44 0   GCGAUGAAG-C=====C-GGAAGUGGA\1"
1068            "CPPParap\1" "  CPPParap            2     0  2.2  49    44 0   GCGAUGAAG-==C===C-GGGAACGGA\1"
1069            "ClfPerfr\1" "  ClfPerfr            2     0  2.2  50    45 0   CGAUGAAGU-==C===C-GGGAAACGG\1"
1070            "VblVulni\1" "  VblVulni            2     0  2.2  52    47 0   ACAGAGAAA-C==G===-CUCGGGUGG\1"
1071            "BcSSSS00\1" "  BcSSSS00            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-CU.\1"
1072            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 179   165 0   UUAAUACCC-C=C====-CU.\1"
1073            "PbcAcet2\1" "  PbcAcet2            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-NN.\1"
1074            "PbrPropi\1" "  PbrPropi            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-NN.\1"
1075            "Stsssola\1" "  Stsssola            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-.\1"
1076            "DcdNodos\1" "  DcdNodos            2     0  2.2 179   165 0   UUGGAUCAC-C=C====-.\1"
1077            "VbrFurni\1" "  VbrFurni            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-.\1"
1078            "VblVulni\1" "  VblVulni            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-.\1"
1079            "VbhChole\1" "  VbhChole            2     0  2.2 179   165 0   CUGGAUCAC-C=C====-.\1"
1080            "BcSSSS00\1" "  BcSSSS00            2     2  1.4 183   169 0   AUCACCUCC-=====..-\1"
1081            "ClfPerfr\1" "  ClfPerfr            2     2  1.4 183   169 0   UACCCCUCC-=====..-\1";
1082
1083        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1084        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1085        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1086    }
1087    {
1088        const char *arguments[] = {
1089            "prgnamefake",
1090            "matchsequence=UCACCUCCUUUC", // contains no N
1091            NULL, // matchmismatches
1092            "matchacceptN=0",
1093        };
1094
1095        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
1096            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1" "";
1097
1098        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
1099            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
1100            "PbcAcet2\1" "  PbcAcet2            1     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
1101            "PbrPropi\1" "  PbrPropi            1     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
1102            "Stsssola\1" "  Stsssola            1     1  0.7 175   161 0   GCGGCUGGA-===========.-\1"
1103            "DcdNodos\1" "  DcdNodos            1     1  0.7 175   161 0   GCGGUUGGA-===========.-\1"
1104            "VbrFurni\1" "  VbrFurni            1     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
1105            "VblVulni\1" "  VblVulni            1     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
1106            "VbhChole\1" "  VbhChole            1     1  0.7 175   161 0   GGCGCUGGA-===========.-\1";
1107
1108        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUC'\1"
1109            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-============-U.\1"
1110            "PbcAcet2\1" "  PbcAcet2            1     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
1111            "PbrPropi\1" "  PbrPropi            1     1  0.7 175   161 0   GCGGCUGGA-===========N-N.\1"
1112            "Stsssola\1" "  Stsssola            1     1  0.7 175   161 0   GCGGCUGGA-===========.-\1"
1113            "DcdNodos\1" "  DcdNodos            1     1  0.7 175   161 0   GCGGUUGGA-===========.-\1"
1114            "VbrFurni\1" "  VbrFurni            1     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
1115            "VblVulni\1" "  VblVulni            1     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
1116            "VbhChole\1" "  VbhChole            1     1  0.7 175   161 0   GGCGCUGGA-===========.-\1"
1117            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 175   161 0   AAGAUUAAU-A=C=========-U.\1"
1118            "AclPleur\1" "  AclPleur            2     1  1.8 175   161 0   GCGGUUGGA-==========A.-\1"
1119            "PtVVVulg\1" "  PtVVVulg            2     1  1.8 175   161 0   GCGGUUGGA-==========A.-\1"
1120            "DlcTolu2\1" "  DlcTolu2            2     2  1.4 175   161 0   GCGGCUGGA-==========NN-N.\1"
1121            "FrhhPhil\1" "  FrhhPhil            2     2  1.4 175   161 0   GCGGCUGGA-==========..-\1"
1122            "HllHalod\1" "  HllHalod            2     2  1.4 175   161 0   GCGGCUGGA-==========..-\1"
1123            "CPPParap\1" "  CPPParap            2     2  1.4 176   162 0   GCGGNUGGA-==========..-\1";
1124
1125        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1126        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1127        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1128    }
1129    {
1130        const char *arguments[] = {
1131            "prgnamefake",
1132            "matchsequence=UCACCUCCUUUCU", // contains no N
1133            NULL, // matchmismatches
1134            "matchacceptN=0",
1135        };
1136
1137        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUCU'\1"
1138            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-=============-.\1";
1139
1140        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUCU'\1"
1141            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-=============-.\1"
1142            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 175   161 0   AAGAUUAAU-A=C==========-.\1"
1143            "PbcAcet2\1" "  PbcAcet2            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1144            "PbrPropi\1" "  PbrPropi            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1145            "Stsssola\1" "  Stsssola            2     2  1.4 175   161 0   GCGGCUGGA-===========..-\1"
1146            "DcdNodos\1" "  DcdNodos            2     2  1.4 175   161 0   GCGGUUGGA-===========..-\1"
1147            "VbrFurni\1" "  VbrFurni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1148            "VblVulni\1" "  VblVulni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1149            "VbhChole\1" "  VbhChole            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1";
1150
1151        CCP expectd3 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUCU'\1"
1152            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-=============-.\1"
1153            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 175   161 0   AAGAUUAAU-A=C==========-.\1"
1154            "PbcAcet2\1" "  PbcAcet2            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1155            "PbrPropi\1" "  PbrPropi            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1156            "Stsssola\1" "  Stsssola            2     2  1.4 175   161 0   GCGGCUGGA-===========..-\1"
1157            "DcdNodos\1" "  DcdNodos            2     2  1.4 175   161 0   GCGGUUGGA-===========..-\1"
1158            "VbrFurni\1" "  VbrFurni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1159            "VblVulni\1" "  VblVulni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1160            "VbhChole\1" "  VbhChole            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1161            "AclPleur\1" "  AclPleur            3     2  2.5 175   161 0   GCGGUUGGA-==========A..-\1"
1162            "PtVVVulg\1" "  PtVVVulg            3     2  2.5 175   161 0   GCGGUUGGA-==========A..-\1"
1163            "DlcTolu2\1" "  DlcTolu2            3     3  2.1 175   161 0   GCGGCUGGA-==========NNN-.\1"
1164            "FrhhPhil\1" "  FrhhPhil            3     3  2.1 175   161 0   GCGGCUGGA-==========...-\1"
1165            "HllHalod\1" "  HllHalod            3     3  2.1 175   161 0   GCGGCUGGA-==========...-\1"
1166            "CPPParap\1" "  CPPParap            3     3  2.1 176   162 0   GCGGNUGGA-==========...-\1";
1167
1168        CCP expectd4 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUCU'\1"
1169            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-=============-.\1"
1170            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 175   161 0   AAGAUUAAU-A=C==========-.\1"
1171            "PbcAcet2\1" "  PbcAcet2            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1172            "PbrPropi\1" "  PbrPropi            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1173            "Stsssola\1" "  Stsssola            2     2  1.4 175   161 0   GCGGCUGGA-===========..-\1"
1174            "DcdNodos\1" "  DcdNodos            2     2  1.4 175   161 0   GCGGUUGGA-===========..-\1"
1175            "VbrFurni\1" "  VbrFurni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1176            "VblVulni\1" "  VblVulni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1177            "VbhChole\1" "  VbhChole            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1178            "AclPleur\1" "  AclPleur            3     2  2.5 175   161 0   GCGGUUGGA-==========A..-\1"
1179            "PtVVVulg\1" "  PtVVVulg            3     2  2.5 175   161 0   GCGGUUGGA-==========A..-\1"
1180            "DlcTolu2\1" "  DlcTolu2            3     3  2.1 175   161 0   GCGGCUGGA-==========NNN-.\1"
1181            "FrhhPhil\1" "  FrhhPhil            3     3  2.1 175   161 0   GCGGCUGGA-==========...-\1"
1182            "HllHalod\1" "  HllHalod            3     3  2.1 175   161 0   GCGGCUGGA-==========...-\1"
1183            "CPPParap\1" "  CPPParap            3     3  2.1 176   162 0   GCGGNUGGA-==========...-\1"
1184            "LgtLytic\1" "  LgtLytic            4     4  2.8 175   161 0   GCGGCUGGA-=========N...-\1"
1185            "PslFlave\1" "  PslFlave            4     4  2.8 175   161 0   GCGGCUGGA-=========....-\1";
1186
1187        CCP expectd5 = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCACCUCCUUUCU'\1"
1188            "BcSSSS00\1" "  BcSSSS00            0     0  0.0 175   161 0   GCGGCUGGA-=============-.\1"
1189            "ClfPerfr\1" "  ClfPerfr            2     0  2.2 175   161 0   AAGAUUAAU-A=C==========-.\1"
1190            "PbcAcet2\1" "  PbcAcet2            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1191            "PbrPropi\1" "  PbrPropi            2     2  1.4 175   161 0   GCGGCUGGA-===========NN-.\1"
1192            "Stsssola\1" "  Stsssola            2     2  1.4 175   161 0   GCGGCUGGA-===========..-\1"
1193            "DcdNodos\1" "  DcdNodos            2     2  1.4 175   161 0   GCGGUUGGA-===========..-\1"
1194            "VbrFurni\1" "  VbrFurni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1195            "VblVulni\1" "  VblVulni            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1196            "VbhChole\1" "  VbhChole            2     2  1.4 175   161 0   GGCGCUGGA-===========..-\1"
1197            "AclPleur\1" "  AclPleur            3     2  2.5 175   161 0   GCGGUUGGA-==========A..-\1"
1198            "PtVVVulg\1" "  PtVVVulg            3     2  2.5 175   161 0   GCGGUUGGA-==========A..-\1"
1199            "DlcTolu2\1" "  DlcTolu2            3     3  2.1 175   161 0   GCGGCUGGA-==========NNN-.\1"
1200            "FrhhPhil\1" "  FrhhPhil            3     3  2.1 175   161 0   GCGGCUGGA-==========...-\1"
1201            "HllHalod\1" "  HllHalod            3     3  2.1 175   161 0   GCGGCUGGA-==========...-\1"
1202            "CPPParap\1" "  CPPParap            3     3  2.1 176   162 0   GCGGNUGGA-==========...-\1"
1203            "LgtLytic\1" "  LgtLytic            4     4  2.8 175   161 0   GCGGCUGGA-=========N...-\1"
1204            "PslFlave\1" "  PslFlave            4     4  2.8 175   161 0   GCGGCUGGA-=========....-\1"
1205            "PtVVVulg\1" "  PtVVVulg            5     0  2.6  50    45 0   GGAGAAAGC-=ug=u=u===g==-GACGAGCGG\1"
1206            "AclPleur\1" "  AclPleur            5     0  3.5  46    41 0   ACGGGAAGG-gag=u=G======-UUGCCGACG\1"
1207            "PtVVVulg\1" "  PtVVVulg            5     0  4.0  45    40 0   ...AGGAGA-Aag=u=G======-UGCUGACGA\1"
1208            "VblVulni\1" "  VblVulni            5     0  4.3  48    43 0   CAGCACAGA-ga=a==uG=====-CGGGUGGCG\1";
1209
1210        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1211        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1212        arguments[2] = "matchmismatches=3"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd3);
1213        arguments[2] = "matchmismatches=4"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd4);
1214        arguments[2] = "matchmismatches=5"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd5);
1215    }
1216
1217    // ----------------------------------
1218    //      accept several N-matches
1219
1220    {
1221        const char *arguments[] = {
1222            "prgnamefake",
1223            "matchsequence=CANCUCCUUNC", // contains 2 N
1224            NULL, // matchmismatches
1225            "matchacceptN=2",
1226            "matchlimitN=4",
1227        };
1228
1229        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUNC'\1"
1230            "BcSSSS00\1" "  BcSSSS00            0     2  1.7 176   162 0   CGGCUGGAU-==C======U=-U.\1";
1231
1232        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUNC'\1"
1233            "BcSSSS00\1" "  BcSSSS00            0     2  1.7 176   162 0   CGGCUGGAU-==C======U=-U.\1"
1234            "ClfPerfr\1" "  ClfPerfr            1     2  2.8 176   162 0   AGAUUAAUA-=CC======U=-U.\1"
1235            "DlcTolu2\1" "  DlcTolu2            1     3  2.4 176   162 0   CGGCUGGAU-==C=======N-N.\1"
1236            "FrhhPhil\1" "  FrhhPhil            1     3  2.4 176   162 0   CGGCUGGAU-==C======..-\1"
1237            "HllHalod\1" "  HllHalod            1     3  2.4 176   162 0   CGGCUGGAU-==C======..-\1"
1238            "CPPParap\1" "  CPPParap            1     3  2.4 177   163 0   CGGNUGGAU-==C======..-\1"
1239            "PbcAcet2\1" "  PbcAcet2            1     3  2.4 176   162 0   CGGCUGGAU-==C======UN-N.\1"
1240            "PbrPropi\1" "  PbrPropi            1     3  2.4 176   162 0   CGGCUGGAU-==C======UN-N.\1"
1241            "Stsssola\1" "  Stsssola            1     3  2.4 176   162 0   CGGCUGGAU-==C======U.-\1"
1242            "DcdNodos\1" "  DcdNodos            1     3  2.4 176   162 0   CGGUUGGAU-==C======U.-\1"
1243            "VbrFurni\1" "  VbrFurni            1     3  2.4 176   162 0   GCGCUGGAU-==C======U.-\1"
1244            "VblVulni\1" "  VblVulni            1     3  2.4 176   162 0   GCGCUGGAU-==C======U.-\1"
1245            "VbhChole\1" "  VbhChole            1     3  2.4 176   162 0   GCGCUGGAU-==C======U.-\1"
1246            "AclPleur\1" "  AclPleur            1     3  2.5 176   162 0   CGGUUGGAU-==C======A.-\1"
1247            "PtVVVulg\1" "  PtVVVulg            1     3  2.5 176   162 0   CGGUUGGAU-==C======A.-\1";
1248
1249        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCUCCUUNC'\1"
1250            "BcSSSS00\1" "  BcSSSS00            0     2  1.7 176   162 0   CGGCUGGAU-==C======U=-U.\1"
1251            "ClfPerfr\1" "  ClfPerfr            1     2  2.8 176   162 0   AGAUUAAUA-=CC======U=-U.\1"
1252            "DlcTolu2\1" "  DlcTolu2            1     3  2.4 176   162 0   CGGCUGGAU-==C=======N-N.\1"
1253            "FrhhPhil\1" "  FrhhPhil            1     3  2.4 176   162 0   CGGCUGGAU-==C======..-\1"
1254            "HllHalod\1" "  HllHalod            1     3  2.4 176   162 0   CGGCUGGAU-==C======..-\1"
1255            "CPPParap\1" "  CPPParap            1     3  2.4 177   163 0   CGGNUGGAU-==C======..-\1"
1256            "PbcAcet2\1" "  PbcAcet2            1     3  2.4 176   162 0   CGGCUGGAU-==C======UN-N.\1"
1257            "PbrPropi\1" "  PbrPropi            1     3  2.4 176   162 0   CGGCUGGAU-==C======UN-N.\1"
1258            "Stsssola\1" "  Stsssola            1     3  2.4 176   162 0   CGGCUGGAU-==C======U.-\1"
1259            "DcdNodos\1" "  DcdNodos            1     3  2.4 176   162 0   CGGUUGGAU-==C======U.-\1"
1260            "VbrFurni\1" "  VbrFurni            1     3  2.4 176   162 0   GCGCUGGAU-==C======U.-\1"
1261            "VblVulni\1" "  VblVulni            1     3  2.4 176   162 0   GCGCUGGAU-==C======U.-\1"
1262            "VbhChole\1" "  VbhChole            1     3  2.4 176   162 0   GCGCUGGAU-==C======U.-\1"
1263            "AclPleur\1" "  AclPleur            1     3  2.5 176   162 0   CGGUUGGAU-==C======A.-\1"
1264            "PtVVVulg\1" "  PtVVVulg            1     3  2.5 176   162 0   CGGUUGGAU-==C======A.-\1";
1265
1266        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1267        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1268        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1269    }
1270
1271    {
1272        const char *arguments[] = {
1273            "prgnamefake",
1274            "matchsequence=GAGCGGUCAG", // similar to a region where dots occur in seqdata
1275            NULL, // matchmismatches
1276            "matchacceptN=0",
1277            "matchlimitN=4",
1278        };
1279
1280        CCP expectd0 = "";
1281
1282        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'GAGCGGUCAG'\1"
1283            "BcSSSS00\1" "  BcSSSS00            1     0  1.1  25    21 0   GAUCAAGUC-======A===-AUGGGAGCU\1";
1284
1285        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'GAGCGGUCAG'\1"
1286            "BcSSSS00\1" "  BcSSSS00            1     0  1.1  25    21 0   GAUCAAGUC-======A===-AUGGGAGCU\1"
1287            "Bl0LLL00\1" "  Bl0LLL00            2     0  2.2  25    21 0   GAUCAAGUC-======A=C=-ACGGGAGCU\1";
1288
1289        // this probe-match is also tested with 'arb_probe_match'. see arb_test.cxx@TEST_arb_probe_match
1290        CCP expectd3 = "    name---- fullname mis N_mis wmis pos ecoli rev          'GAGCGGUCAG'\1"
1291            "BcSSSS00\1" "  BcSSSS00            1     0  1.1  25    21 0   GAUCAAGUC-======A===-AUGGGAGCU\1"
1292            "Bl0LLL00\1" "  Bl0LLL00            2     0  2.2  25    21 0   GAUCAAGUC-======A=C=-ACGGGAGCU\1"
1293            "VbrFurni\1" "  VbrFurni            3     0  2.4  68    60 0   GGAUUUGUU-=g====CG==-CGGCGGACG\1"
1294            "FrhhPhil\1" "  FrhhPhil            3     0  2.8  82    70 0   ACGAGUGGC-=gA===C===-UUGGAAACG\1"
1295            "ClfPerfr\1" "  ClfPerfr            3     0  3.2  86    74 0   CGGCGGGAC-=g==CU====-AACCUGCGG\1"
1296            "HllHalod\1" "  HllHalod            3     0  3.6  25    21 0   GAUCAAGUC-======Aa=C-GAUGGAAGC\1"
1297            "DlcTolu2\1" "  DlcTolu2            3     0  3.6  95    83 0   GGACUGCCC-==Aa==A===-CUAAUACCG\1"
1298            "FrhhPhil\1" "  FrhhPhil            3     0  4.0  25    21 0   GAUCAAGUC-==A====a=C-AGGUCUUCG\1"
1299            "AclPleur\1" "  AclPleur            3     0  4.0  29    24 0   GAUCAAGUC-==A====a=C-GGGAAGGGA\1"
1300            "ClnCorin\1" "  ClnCorin            3     0  4.1  25    21 0   GAUCAAGUC-=====A=G=A-GUUCCUUCG\1"
1301            "CltBotul\1" "  CltBotul            3     0  4.1  25    21 0   .AUCAAGUC-=====A=G=A-GCUUCUUCG\1"
1302            "CPPParap\1" "  CPPParap            3     0  4.1  25    21 0   GAUCAAGUC-=====A=G=A-GUUCCUUCG\1"
1303            "ClfPerfr\1" "  ClfPerfr            3     0  4.1  25    21 0   GAUCAAGUC-=====A=G=A-GUUUCCUUC\1"
1304            "DlcTolu2\1" "  DlcTolu2            3     0  4.1 157   143 0   GUAGCCGUU-===GAA====-CGGCUGGAU\1"
1305            "PslFlave\1" "  PslFlave            3     3  2.4  25    21 0   GAUCAAGUC-=======...-<more>\1"
1306            "PtVVVulg\1" "  PtVVVulg            3     3  2.4  29    24 0   GAUCAAGUC-=======...-<more>\1";
1307
1308        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1309        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1310        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1311        arguments[2] = "matchmismatches=3"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd3);
1312    }
1313
1314    {
1315        const char *arguments[] = {
1316            "prgnamefake",
1317            "matchsequence=GAGCGGUCAGGAG", // as above, but continues behind '...'
1318            NULL, // matchmismatches
1319            "matchweighted=1",            // use weighted mismatches
1320        };
1321
1322        CCP expectd2 = "";
1323        CCP expectd3 = "    name---- fullname mis N_mis wmis pos ecoli rev          'GAGCGGUCAGGAG'\1"
1324            "ClnCorin\1" "  ClnCorin            6     0  3.4  77    66 0   AUGGAUUAG-Cg====A=g==CC-UUUCGAAAG\1"
1325            "CltBotul\1" "  CltBotul            6     0  3.4  77    66 0   GUGGAUUAG-Cg====A=g==CC-UUUCGAAAG\1"
1326            "CPPParap\1" "  CPPParap            6     0  3.4  77    66 0   ACGGAUUAG-Cg====A=g==CC-UUCCGAAAG\1"
1327            "BcSSSS00\1" "  BcSSSS00            3     0  3.4  25    21 0   GAUCAAGUC-======A===AU=-GGAGCUUGC\1";
1328
1329        CCP expectd4 = "    name---- fullname mis N_mis wmis pos ecoli rev          'GAGCGGUCAGGAG'\1"
1330            "ClnCorin\1" "  ClnCorin            6     0  3.4  77    66 0   AUGGAUUAG-Cg====A=g==CC-UUUCGAAAG\1"
1331            "CltBotul\1" "  CltBotul            6     0  3.4  77    66 0   GUGGAUUAG-Cg====A=g==CC-UUUCGAAAG\1"
1332            "CPPParap\1" "  CPPParap            6     0  3.4  77    66 0   ACGGAUUAG-Cg====A=g==CC-UUCCGAAAG\1"
1333            "BcSSSS00\1" "  BcSSSS00            3     0  3.4  25    21 0   GAUCAAGUC-======A===AU=-GGAGCUUGC\1"
1334            "ClfPerfr\1" "  ClfPerfr            6     0  3.9 121   108 0   AUCAUAAUG-C====A=ug==gU-GAAGUCGUA\1"
1335            "ClnCorin\1" "  ClnCorin            6     0  3.9 122   109 0   CGCAUAAGA-C====A=ug==gU-GAAGUCGUA\1"
1336            "CltBotul\1" "  CltBotul            6     0  3.9 122   109 0   CUCAUAAGA-C====A=ug==gU-GAAGUCGUA\1"
1337            "CPPParap\1" "  CPPParap            6     0  3.9 122   109 0   GCAUAAGAU-C====A=ug==gU-AAGUCGUAA\1"
1338            "DcdNodos\1" "  DcdNodos            6     0  4.2  77    66 0   GUAACCUAG-Ug====A=g=AC=-UAUGGAAAC\1"
1339            "PsAAAA00\1" "  PsAAAA00            6     0  4.2  77    66 0   UGGAUUCAG-Cg====A=g=AC=-UCCGGAAAC\1"
1340            "PslFlave\1" "  PslFlave            6     0  4.2  77    66 0   CUGAUUCAG-Cg====A=g=AC=-UUUCGAAAG\1"
1341            "FrhhPhil\1" "  FrhhPhil            5     0  4.2 149   135 0   UAACAAUGG-U===C==ag===A-CCUGCGGCU\1"
1342            "AclPleur\1" "  AclPleur            4     0  4.3  29    24 0   GAUCAAGUC-==A====a=C=g=-AAGGGAGCU\1"
1343            "PbcAcet2\1" "  PbcAcet2            6     0  4.3 149   135 0   GUAACAAGG-U===C==ag==gA-ACCUGCGGC\1"
1344            "PbrPropi\1" "  PbrPropi            6     0  4.3 149   135 0   GUAACAAGG-U===C==ag==gA-ACCUGCGGC\1"
1345            "Stsssola\1" "  Stsssola            6     0  4.3 149   135 0   GUAACAAGG-U===C==ag==gA-ACCUGCGGC\1"
1346            "LgtLytic\1" "  LgtLytic            6     0  4.3 149   135 0   GUAACAAGG-U===C==ag==gA-ACCUGCGGC\1"
1347            "PslFlave\1" "  PslFlave            6     0  4.3 149   135 0   GUAACAAGG-U===C==ag==gA-ACCUGCGGC\1"
1348            "HllHalod\1" "  HllHalod            6     0  4.3 149   135 0   GUAACAAGG-U===C==ag==gA-ACCUGCGGC\1"
1349            "VbrFurni\1" "  VbrFurni            5     0  4.4  68    60 0   GGAUUUGUU-=g====CG==Cg=-CGGACGGAC\1"
1350            "AclPleur\1" "  AclPleur            6     0  4.4  35    30 0   GUCGAACGG-U=A===ga===gA-GCUUGCUUU\1"
1351            "PslFlave\1" "  PslFlave            6     6  4.4  25    21 0   GAUCAAGUC-=======......-<more>\1"
1352            "PtVVVulg\1" "  PtVVVulg            6     6  4.4  29    24 0   GAUCAAGUC-=======......-<more>\1"
1353            "VbrFurni\1" "  VbrFurni            6     0  4.4 149   135 0   GUAACAAGG-U====C=ag==gA-ACCUGGCGC\1"
1354            "VblVulni\1" "  VblVulni            6     0  4.4 149   135 0   GUAACAAGG-U====C=ag==gA-ACCUGGCGC\1"
1355            "VbhChole\1" "  VbhChole            6     0  4.4 149   135 0   GUAACAAGG-U====C=ag==gA-ACCUGGCGC\1";
1356
1357        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1358        arguments[2] = "matchmismatches=3"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd3);
1359        arguments[2] = "matchmismatches=4"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd4);
1360    }
1361
1362    // --------------------------
1363    //      truncate results
1364
1365    {
1366        const char *arguments[] = {
1367            "prgnamefake",
1368            "matchsequence=CANCNCNNUNC", // contains 5N
1369            NULL, // matchmismatches
1370            "matchacceptN=5",
1371            "matchlimitN=7",
1372            "matchmaxresults=5",
1373        };
1374
1375        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCNCNNUNC'\1"
1376            "BcSSSS00\1" "  BcSSSS00            0     5  4.2 176   162 0   CGGCUGGAU-==C=U=CU=U=-U.\1";
1377
1378        // many hits are truncated here:
1379        CCP expectd1 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCNCNNUNC'\1"
1380            "DlcTolu2\1" "  DlcTolu2            1     6  4.9 176   162 0   CGGCUGGAU-==C=U=CU==N-N.\1"
1381            "FrhhPhil\1" "  FrhhPhil            1     6  4.9 176   162 0   CGGCUGGAU-==C=U=CU=..-\1"
1382            "HllHalod\1" "  HllHalod            1     6  4.9 176   162 0   CGGCUGGAU-==C=U=CU=..-\1"
1383            "CPPParap\1" "  CPPParap            1     6  4.9 177   163 0   CGGNUGGAU-==C=U=CU=..-\1"
1384            "AclPleur\1" "  AclPleur            1     6  5.0 176   162 0   CGGUUGGAU-==C=U=CU=A.-\1";
1385
1386        // many hits are truncated here:
1387        CCP expectd2 = "    name---- fullname mis N_mis wmis pos ecoli rev          'CANCNCNNUNC'\1"
1388            "HllHalod\1" "  HllHalod            2     5  5.1  45    40 0   AAACGAUGG-a=G=UuGC=U=-CAGGCGUCG\1"
1389            "VblVulni\1" "  VblVulni            2     5  5.4  49    44 0   AGCACAGAG-a=A=UuGU=U=-UCGGGUGGC\1"
1390            "VbrFurni\1" "  VbrFurni            2     5  5.7  40    35 0   CGGCAGCGA-==A=AuUGAA=-CUUCGGGGG\1"
1391            "LgtLytic\1" "  LgtLytic            2     5  6.2 101    89 0   GGGGAAACU-==AGCuAA=A=-CGCAUAAUC\1"
1392            "ClfPerfr\1" "  ClfPerfr            2     5  6.5 172   158 0   AGGAAGAUU-a=UaC=CC=C=-UUUCU.\1";
1393
1394        arguments[2] = "matchmismatches=0"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1395        arguments[2] = "matchmismatches=1"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd1);
1396        arguments[2] = "matchmismatches=2"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd2);
1397    }
1398
1399    // -------------------------------------------------------------
1400    //      tests related to http://bugs.arb-home.de/ticket/410
1401    {
1402        const char *arguments[] = {
1403            "prgnamefake",
1404            "matchsequence=ACGGACUCCGGGAAACCGGGGCUAAUACC", // length=29
1405            NULL, // matchmismatches
1406            "matchacceptN=5",
1407            "matchlimitN=7",
1408            "matchmaxresults=10",
1409        };
1410
1411        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'ACGGACUCCGGGAAACCGGGGCUAAUACC'\1"
1412            "BcSSSS00\1" "  BcSSSS00            0     0  0.0  84    72 0   UAGCGGCGG-=============================-GGAUGGUGA\1"
1413            "Bl0LLL00\1" "  Bl0LLL00            0     0  0.0  84    72 0   CAGCGGCGG-=============================-GGAUGCUGA\1"
1414            "AclPleur\1" "  AclPleur            4     0  4.6  84    72 0   GAGUGGCGG-=======a========u=UA=========-GCGUAAUCA\1"
1415            "PtVVVulg\1" "  PtVVVulg            4     0  5.1  84    72 0   GAGCGGCGG-=======a=U======G=U==========-GCAUGACCA\1"
1416            "DsssDesu\1" "  DsssDesu            5     0  5.3  84    72 0   GAGUGGCGC-========u=C====Gu==A=========-GGAUACAGA\1"
1417            "PsAAAA00\1" "  PsAAAA00            5     0  5.3  84    72 0   CAGCGGCGG-======gu=C======G==C=========-GCAUACGCA\1";
1418
1419        arguments[2] = "matchmismatches=5"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1420    }
1421    {
1422        const char *arguments[] = {
1423            "prgnamefake",
1424            "matchsequence=ACGGACUCCGGGAAACCGGGGCUAAUACCGGAUGGUGA", // length=38
1425            NULL, // matchmismatches
1426            "matchacceptN=5",
1427            "matchlimitN=7",
1428            "matchmaxresults=100",
1429        };
1430
1431        CCP expectd0 = "    name---- fullname mis N_mis wmis pos ecoli rev          'ACGGACUCCGGGAAACCGGGGCUAAUACCGGAUGGUGA'\1"
1432            "BcSSSS00\1" "  BcSSSS00            0     0  0.0  84    72 0   UAGCGGCGG-======================================-UGAUUGGGG\1"
1433            "Bl0LLL00\1" "  Bl0LLL00            1     0  1.5  84    72 0   CAGCGGCGG-==================================C===-UGAUUGGGG\1"
1434            "DsssDesu\1" "  DsssDesu            8     0  9.4  84    72 0   GAGUGGCGC-========u=C====Gu==A=============ACA==-G.\1"
1435            "PtVVVulg\1" "  PtVVVulg            8     0 10.7  84    72 0   GAGCGGCGG-=======a=U======G=U===========C===ACC=-UGACUGGGG\1"
1436            "AclPleur\1" "  AclPleur            9     0 10.8  84    72 0   GAGUGGCGG-=======a========u=UA==========Cg=AA=C=-UGACUGGGG\1"
1437            "PsAAAA00\1" "  PsAAAA00           10     0 11.9  84    72 0   CAGCGGCGG-======gu=C======G==C==========C==ACgC=-UGGUAACAA\1"
1438            "LgtLytic\1" "  LgtLytic           10     0 12.8  84    72 0   GAGNGGCGA-=======uG=======uCAA==========C==AA=C=-UGACUGGGG\1"
1439            "VbrFurni\1" "  VbrFurni           10     0 12.8  84    72 0   GAGCGGCGG-======CauU======GAU===========C===A=C=-UGACUGGGG\1"
1440            "VblVulni\1" "  VblVulni           10     0 12.8  84    72 0   GAGCGGCGG-======CauU======GAU===========C===A=C=-UGACUGGGG\1"
1441            "Stsssola\1" "  Stsssola           10     0 12.9  84    72 0   AAGUGGCGC-======gG=U======G=UC=============AACA=-UGAUUGGGG\1"
1442            "DlcTolu2\1" "  DlcTolu2           10     0 13.4  84    72 0   GAGUGGCGC-=======G=CC====GGACA==============AA==-UAAUUGGGG\1"
1443            "PbcAcet2\1" "  PbcAcet2           11     0 12.2  84    72 0   AAGUGGCGC-======A=uUC====GG==U=============AAg=g-UAACUGGGG\1"
1444            "HllHalod\1" "  HllHalod           11     0 13.0  84    72 0   GAGCGGCGG-======CuG=======uCA===========C==ACgC=-UGACUGGGG\1"
1445            "PbrPropi\1" "  PbrPropi           12     0 13.6  84    72 0   UAGUGGCGC-======A=uUC====Ga==U=========U===AAg=g-UGACUGGGG\1"
1446            "DcdNodos\1" "  DcdNodos           12     0 14.4  84    72 0   UAGUGGCGG-======guaU======GUAC==========C==AAg==-UGACUGGGG\1"
1447            "VbhChole\1" "  VbhChole           12     0 15.4  84    72 0   GAGCGGCGG-======CauU======GAU===========C==AACC=-UGACUGGGG\1";
1448
1449        arguments[2] = "matchmismatches=12"; TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expectd0);
1450    }
1451
1452
1453    // test expected errors
1454    {
1455        const char *arguments[] = {
1456            "prgnamefake",
1457            "matchsequence=ACGGACUCCGGGAAACCGGGGCUAAUACCGGAUGGUGA", // length = 38
1458            "matchmismatches=20",
1459        };
1460
1461        TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, "Max. 19 mismatches are allowed for probes of length 38");
1462    }
1463}
1464
1465static char *extract_locations(const char *probe_design_result) {
1466    const char *Target = strstr(probe_design_result, "\nTarget");
1467    if (Target) {
1468        const char *designed = strchr(Target+7, '\n');
1469        if (designed) {
1470            ++designed;
1471
1472            GBS_strstruct result(300);
1473            RegExpr reg_designed("^[A-Z]+"
1474                                 "[[:space:]]+[0-9]+"
1475                                 "[[:space:]]+([A-Z][=+-])" // subexpr #1 (loc+-=)
1476                                 "[[:space:]]*([0-9]+)",    // subexpr #2 (abs or locrel)
1477                                 true);
1478
1479
1480            while (designed) {
1481                const char     *eol   = strchr(designed, '\n');
1482                const RegMatch *match = reg_designed.match(designed); if (!match) break;
1483
1484                match           = reg_designed.subexpr_match(1); if (!match) break;
1485                std::string loc = match->extract(designed);
1486
1487                match           = reg_designed.subexpr_match(2); if (!match) break;
1488                std::string pos = match->extract(designed);
1489
1490                result.cat(loc.c_str());
1491                result.cat(pos.c_str());
1492
1493                designed = eol ? eol+1 : NULL;
1494            }
1495
1496            return result.release();
1497        }
1498    }
1499    return ARB_strdup("can't extract");
1500}
1501
1502inline const char *next_line(const char *this_line) {
1503    const char *lf = strchr(this_line, '\n');
1504    return (lf && lf[1] && strchr("ACGTU", lf[1])) ? lf+1 : NULL;
1505}
1506inline int count_hits(const char *design_result) {
1507    const char *target = strstr(design_result, "\nTarget");
1508    if (target) {
1509        const char *hit  = next_line(target+1);
1510        int         hits = 0;
1511
1512        while (hit) {
1513            ++hits;
1514            hit = next_line(hit);
1515        }
1516        return hits;
1517    }
1518    return -1;
1519}
1520
1521void TEST_SLOW_design_probe() {
1522    // test here runs versus database ../UNIT_TESTER/run/TEST_pt_src.arb
1523
1524    bool use_gene_ptserver = false;
1525    {
1526        int hits_len_18;
1527        {
1528            const char *arguments[] = {
1529                "prgnamefake",
1530                "designnames=ClnCorin#CltBotul#CPPParap#ClfPerfr",
1531                "designmintargets=100",
1532            };
1533            const char *expected =
1534                "Probe design parameters:\n"
1535                "Length of probe    18\n"
1536                "Temperature        [ 0.0 -400.0]\n"
1537                "GC-content         [30.0 - 80.0]\n"
1538                "E.Coli position    [any]\n"
1539                "Max. nongroup hits 0\n"
1540                "Min. group hits    100% (max. rejected coverage: 75%)\n"
1541                "Target             le apos ecol qual grps   G+C temp     Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1542                "CGAAAGGAAGAUUAAUAC 18 A=94   82   77    4  33.3 48.0 GUAUUAAUCUUCCUUUCG | - - - - - - - - - - - - - - - - - - - -\n"
1543                "GAAAGGAAGAUUAAUACC 18 A+ 1   83   77    4  33.3 48.0 GGUAUUAAUCUUCCUUUC | - - - - - - - - - - - - - - - - - - - -\n"
1544                "UCAAGUCGAGCGAUGAAG 18 B=18   17   61    4  50.0 54.0 CUUCAUCGCUCGACUUGA | - - - - - - - - - - - - - - - 2 2 2 2 2\n"
1545                "AUCAAGUCGAGCGAUGAA 18 B- 1   16   45    4  44.4 52.0 UUCAUCGCUCGACUUGAU | - - - - - - - - - - - 2 2 2 2 2 2 2 2 2\n";
1546
1547            TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1548            hits_len_18 = count_hits(expected);
1549            TEST_EXPECT_EQUAL(hits_len_18, 4);
1550
1551            // test extraction of positions:
1552            {
1553                char *positions = extract_locations(expected);
1554                TEST_EXPECT_EQUAL(positions, "A=94A+1B=18B-1");
1555                free(positions);
1556            }
1557        }
1558        // same as above with probelength 17
1559        int hits_len_17;
1560        {
1561            const char *arguments[] = {
1562                "prgnamefake",
1563                "designnames=ClnCorin#CltBotul#CPPParap#ClfPerfr",
1564                "designmintargets=100",
1565                "designprobelength=17",
1566            };
1567            const char *expected =
1568                "Probe design parameters:\n"
1569                "Length of probe    17\n"
1570                "Temperature        [ 0.0 -400.0]\n"
1571                "GC-content         [30.0 - 80.0]\n"
1572                "E.Coli position    [any]\n"
1573                "Max. nongroup hits 0\n"
1574                "Min. group hits    100% (max. rejected coverage: 75%)\n"
1575                "Target            le apos ecol qual grps   G+C temp    Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1576                "CAAGUCGAGCGAUGAAG 17 A=19   18   65    4  52.9 52.0 CUUCAUCGCUCGACUUG | - - - - - - - - - - - - - - - - 2 2 2 2\n"
1577                "UCAAGUCGAGCGAUGAA 17 A- 1   17   49    4  47.1 50.0 UUCAUCGCUCGACUUGA | - - - - - - - - - - - - 2 2 2 2 2 2 2 2\n"
1578                "AUCAAGUCGAGCGAUGA 17 A- 2   16   33    4  47.1 50.0 UCAUCGCUCGACUUGAU | - - - - - - - - 2 2 2 2 2 2 2 2 2 2 2 4\n";
1579
1580            TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1581            hits_len_17 = count_hits(expected);
1582            TEST_EXPECT_EQUAL(hits_len_17, 3);
1583        }
1584        // same as above with probelength 16
1585        int hits_len_16;
1586        {
1587            const char *arguments[] = {
1588                "prgnamefake",
1589                "designnames=ClnCorin#CltBotul#CPPParap#ClfPerfr",
1590                "designmintargets=100",
1591                "designprobelength=16",
1592            };
1593            const char *expected =
1594                "Probe design parameters:\n"
1595                "Length of probe    16\n"
1596                "Temperature        [ 0.0 -400.0]\n"
1597                "GC-content         [30.0 - 80.0]\n"
1598                "E.Coli position    [any]\n"
1599                "Max. nongroup hits 0\n"
1600                "Min. group hits    100% (max. rejected coverage: 75%)\n"
1601                "Target           le apos ecol qual grps   G+C temp   Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1602                "CGAAAGGAAGAUUAAU 16 A=94   82   77    4  31.2 42.0 AUUAAUCUUCCUUUCG | - - - - - - - - - - - - - - - - - - - -\n"
1603                "AAGGAAGAUUAAUACC 16 A+ 3   85   77    4  31.2 42.0 GGUAUUAAUCUUCCUU | - - - - - - - - - - - - - - - - - - - -\n"
1604                "AAGUCGAGCGAUGAAG 16 B=20   19   69    4  50.0 48.0 CUUCAUCGCUCGACUU | - - - - - - - - - - - - - - - - - 2 2 2\n"
1605                "CAAGUCGAGCGAUGAA 16 B- 1   18   49    4  50.0 48.0 UUCAUCGCUCGACUUG | - - - - - - - - - - - - 2 2 2 2 2 2 2 2\n"
1606                "UCAAGUCGAGCGAUGA 16 B- 2   17   37    4  50.0 48.0 UCAUCGCUCGACUUGA | - - - - - - - - - 2 2 2 2 2 2 2 2 2 2 2\n"
1607                "AUCAAGUCGAGCGAUG 16 B- 3   16   21    4  50.0 48.0 CAUCGCUCGACUUGAU | - - - - - 2 2 2 2 2 2 2 2 2 2 2 2 9 9 9\n";
1608
1609            TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1610            hits_len_16 = count_hits(expected);
1611            TEST_EXPECT_EQUAL(hits_len_16, 6);
1612        }
1613        // combine the 3 preceeding designs
1614        int combined_hits;
1615        {
1616            const char *arguments[] = {
1617                "prgnamefake",
1618                "designnames=ClnCorin#CltBotul#CPPParap#ClfPerfr",
1619                "designmintargets=100",
1620                "designprobelength=16",
1621                "designmaxprobelength=18",
1622            };
1623            const char *expected =
1624                "Probe design parameters:\n"
1625                "Length of probe    16-18\n"
1626                "Temperature        [ 0.0 -400.0]\n"
1627                "GC-content         [30.0 - 80.0]\n"
1628                "E.Coli position    [any]\n"
1629                "Max. nongroup hits 0\n"
1630                "Min. group hits    100% (max. rejected coverage: 75%)\n"
1631                "Target             le apos ecol qual grps   G+C temp     Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1632                "CGAAAGGAAGAUUAAU   16 A=94   82   77    4  31.2 42.0   AUUAAUCUUCCUUUCG | - - - - - - - - - - - - - - - - - - - -\n"
1633                "CGAAAGGAAGAUUAAUAC 18 A+ 0   82   77    4  33.3 48.0 GUAUUAAUCUUCCUUUCG | - - - - - - - - - - - - - - - - - - - -\n"
1634                "GAAAGGAAGAUUAAUACC 18 A+ 1   83   77    4  33.3 48.0 GGUAUUAAUCUUCCUUUC | - - - - - - - - - - - - - - - - - - - -\n"
1635                "AAGGAAGAUUAAUACC   16 A+ 3   85   77    4  31.2 42.0   GGUAUUAAUCUUCCUU | - - - - - - - - - - - - - - - - - - - -\n"
1636                "AAGUCGAGCGAUGAAG   16 B=20   19   69    4  50.0 48.0   CUUCAUCGCUCGACUU | - - - - - - - - - - - - - - - - - 2 2 2\n"
1637                "CAAGUCGAGCGAUGAAG  17 B- 1   18   65    4  52.9 52.0  CUUCAUCGCUCGACUUG | - - - - - - - - - - - - - - - - 2 2 2 2\n"
1638                "UCAAGUCGAGCGAUGAAG 18 B- 2   17   61    4  50.0 54.0 CUUCAUCGCUCGACUUGA | - - - - - - - - - - - - - - - 2 2 2 2 2\n"
1639                "UCAAGUCGAGCGAUGAA  17 B- 2   17   49    4  47.1 50.0  UUCAUCGCUCGACUUGA | - - - - - - - - - - - - 2 2 2 2 2 2 2 2\n"
1640                "CAAGUCGAGCGAUGAA   16 B- 1   18   49    4  50.0 48.0   UUCAUCGCUCGACUUG | - - - - - - - - - - - - 2 2 2 2 2 2 2 2\n"
1641                "AUCAAGUCGAGCGAUGAA 18 B- 3   16   45    4  44.4 52.0 UUCAUCGCUCGACUUGAU | - - - - - - - - - - - 2 2 2 2 2 2 2 2 2\n"
1642                "UCAAGUCGAGCGAUGA   16 B- 2   17   37    4  50.0 48.0   UCAUCGCUCGACUUGA | - - - - - - - - - 2 2 2 2 2 2 2 2 2 2 2\n"
1643                "AUCAAGUCGAGCGAUGA  17 B- 3   16   33    4  47.1 50.0  UCAUCGCUCGACUUGAU | - - - - - - - - 2 2 2 2 2 2 2 2 2 2 2 4\n"
1644                "AUCAAGUCGAGCGAUG   16 B- 3   16   21    4  50.0 48.0   CAUCGCUCGACUUGAU | - - - - - 2 2 2 2 2 2 2 2 2 2 2 2 9 9 9\n";
1645
1646            TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1647            combined_hits = count_hits(expected);
1648        }
1649
1650        // check that combined design reports all probes reported by single designs:
1651        TEST_EXPECT_EQUAL(combined_hits, hits_len_16+hits_len_17+hits_len_18);
1652    }
1653    // test vs bug (fails with [8988] .. [9175])
1654    {
1655        const char *arguments[] = {
1656            "prgnamefake",
1657            "designnames=VbhChole#VblVulni",
1658            "designmintargets=50", // hit at least 1 of the 2 targets
1659            "designmingc=60", "designmaxgc=75", // specific GC range
1660        };
1661
1662        const char *expected =
1663            "Probe design parameters:\n"
1664            "Length of probe    18\n"
1665            "Temperature        [ 0.0 -400.0]\n"
1666            "GC-content         [60.0 - 75.0]\n"
1667            "E.Coli position    [any]\n"
1668            "Max. nongroup hits 0 (lowest rejected nongroup hits: 1)\n"
1669            "Min. group hits    50%\n"
1670            "Target             le apos ecol qual grps   G+C temp     Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1671            "AGUCGAGCGGCAGCACAG 18 A=21   20   39    2  66.7 60.0 CUGUGCUGCCGCUCGACU | - - - - - - - - - - - - - - - - - - - -\n"
1672            "GUCGAGCGGCAGCACAGA 18 A+ 1   21   39    2  66.7 60.0 UCUGUGCUGCCGCUCGAC | - - - - - - - - - - - - - - - - - - - -\n"
1673            "UCGAGCGGCAGCACAGAG 18 A+ 2   21   39    2  66.7 60.0 CUCUGUGCUGCCGCUCGA | - - - - - - - - - - - - - - - - - - - -\n"
1674            "AAGUCGAGCGGCAGCACA 18 A- 1   19   25    2  61.1 58.0 UGUGCUGCCGCUCGACUU | - - - - - - - - - - - - 1 1 1 1 1 1 1 1\n"
1675            "CGAGCGGCAGCACAGAGA 18 A+ 3   21   20    1  66.7 60.0 UCUCUGUGCUGCCGCUCG | - - - - - - - - - - - - - - - - - - - -\n"
1676            "CGAGCGGCAGCACAGAGG 18 A+ 3   21   20    1  72.2 62.0 CCUCUGUGCUGCCGCUCG | - - - - - - - - - - - - - - - - - - - -\n"
1677            "GAGCGGCAGCACAGAGAA 18 A+ 4   21   20    1  61.1 58.0 UUCUCUGUGCUGCCGCUC | - - - - - - - - - - - - - - - - - - - -\n"
1678            "GAGCGGCAGCACAGAGGA 18 A+ 4   21   20    1  66.7 60.0 UCCUCUGUGCUGCCGCUC | - - - - - - - - - - - - - - - - - - - -\n"
1679            "AGCGGCAGCACAGAGGAA 18 A+ 5   21   20    1  61.1 58.0 UUCCUCUGUGCUGCCGCU | - - - - - - - - - - - - - - - - - - - -\n"
1680            "GCGGCAGCACAGAGAAAC 18 A+ 6   22   20    1  61.1 58.0 GUUUCUCUGUGCUGCCGC | - - - - - - - - - - - - - - - - - - - -\n"
1681            "GCGGCAGCACAGAGGAAC 18 A+ 6   22   20    1  66.7 60.0 GUUCCUCUGUGCUGCCGC | - - - - - - - - - - - - - - - - - - - -\n"
1682            "CGGCAGCACAGAGGAACU 18 A+ 7   23   20    1  61.1 58.0 AGUUCCUCUGUGCUGCCG | - - - - - - - - - - - - - - - - - - - -\n"
1683            "CUUGUUCCUUGGGUGGCG 18 B=52   47   20    1  61.1 58.0 CGCCACCCAAGGAACAAG | - - - - - - - - - - - - - - - - - - - -\n"
1684            "CUUGUUUCUCGGGUGGCG 18 B+ 0   47   20    1  61.1 58.0 CGCCACCCGAGAAACAAG | - - - - - - - - - - - - - - - - - - - -\n"
1685            "UGUUCCUUGGGUGGCGAG 18 B+ 2   49   20    1  61.1 58.0 CUCGCCACCCAAGGAACA | - - - - - - - - - - - - - - - - - - - -\n"
1686            "UGUUUCUCGGGUGGCGAG 18 B+ 2   49   20    1  61.1 58.0 CUCGCCACCCGAGAAACA | - - - - - - - - - - - - - - - - - - - -\n"
1687            "GUUCCUUGGGUGGCGAGC 18 B+ 3   50   20    1  66.7 60.0 GCUCGCCACCCAAGGAAC | - - - - - - - - - - - - - - - - - - - -\n"
1688            "GUUUCUCGGGUGGCGAGC 18 B+ 3   50   20    1  66.7 60.0 GCUCGCCACCCGAGAAAC | - - - - - - - - - - - - - - - - - - - -\n"
1689            "UUCCUUGGGUGGCGAGCG 18 B+10   57   20    1  66.7 60.0 CGCUCGCCACCCAAGGAA | - - - - - - - - - - - - - - - - - - - -\n"
1690            "UUUCUCGGGUGGCGAGCG 18 B+10   57   20    1  66.7 60.0 CGCUCGCCACCCGAGAAA | - - - - - - - - - - - - - - - - - - - -\n"
1691            "UCCUUGGGUGGCGAGCGG 18 B+11   58   20    1  72.2 62.0 CCGCUCGCCACCCAAGGA | - - - - - - - - - - - - - - - - - - - -\n"
1692            "UUCUCGGGUGGCGAGCGG 18 B+11   58   20    1  72.2 62.0 CCGCUCGCCACCCGAGAA | - - - - - - - - - - - - - - - - - - - -\n"
1693            "CAAGUCGAGCGGCAGCAC 18 A- 2   18   13    2  66.7 60.0 GUGCUGCCGCUCGACUUG | - - - - - - 1 1 1 1 1 1 1 1 1 1 1 1 1 1\n"
1694            "UCAAGUCGAGCGGCAGCA 18 A- 3   17    3    2  61.1 58.0 UGCUGCCGCUCGACUUGA | - 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 3 3\n";
1695
1696        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1697    }
1698
1699    // design MANY probes to test location specifier
1700    {
1701        const char *arguments_loc[] = {
1702            "prgnamefake",
1703            // "designnames=Stsssola#Stsssola", // @@@ crashes the ptserver
1704            "designnames=CPPParap#PsAAAA00",
1705            "designmintargets=50", // hit at least 1 of the 2 targets
1706            "designmingc=0", "designmaxgc=100", // allow all GCs
1707            "designmintemp=30", "designmaxtemp=100", // allow all temp above 30 deg
1708            "designmishit=7",  // allow enough outgroup hits
1709            "designprobelength=9",
1710        };
1711
1712        const char *expected_loc =
1713            "A=29B=51B+1C=99A+8D=112E=80E+2E+3E+4B-1A-5B-6B-5F=124F+1B-2E-7B+0C-5E+2E-1D-1E+6E+7E+8G=89C-2A-1H=61A-6C-1C-3E+3B+3B+4B+5E+5C+1E+4E+6E+7E+8C-7C-6E+5H+1H+2E-6C-4I=152I+1A-7";
1714
1715        TEST_ARB_PROBE_FILT(ARRAY_ELEMS(arguments_loc), arguments_loc, extract_locations, expected_loc);
1716    }
1717
1718    // same as above
1719    {
1720        const char *arguments[] = {
1721            "prgnamefake",
1722            "designnames=CPPParap#PsAAAA00",
1723            "designmintargets=50", // hit at least 1 of the 2 targets
1724            "designmingc=0", "designmaxgc=100", // allow all GCs
1725            "designmintemp=30", "designmaxtemp=100", // allow all temp above 30 deg
1726            "designmishit=7",  // allow enough outgroup hits
1727            "designprobelength=9",
1728        };
1729
1730        const char *expected =
1731            "Probe design parameters:\n"
1732            "Length of probe    9\n"
1733            "Temperature        [30.0 -100.0]\n"
1734            "GC-content         [ 0.0 -100.0]\n"
1735            "E.Coli position    [any]\n"
1736            "Max. nongroup hits 7 (lowest rejected nongroup hits: 9)\n"
1737            "Min. group hits    50%\n"
1738            "Target    le  apos ecol qual grps   G+C temp     Probe | Decrease T by n*.3C -> probe matches n non group species\n"
1739            "GAGCGGAUG  9 A= 29   24   20    1  66.7 30.0 CAUCCGCUC | - -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -\n"
1740            "UGCUCCUGG  9 B= 51   46   20    1  66.7 30.0 CCAGGAGCA | - -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -\n"
1741            "GCUCCUGGA  9 B+  1   47   20    1  66.7 30.0 UCCAGGAGC | - -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -\n"
1742            "CGGGCGCUA  9 C= 99   87   20    1  77.8 32.0 UAGCGCCCG | - -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  -\n"
1743            "GAAGGGAGC  9 A+  8   32   20    1  66.7 30.0 GCUCCCUUC | 1 1  1  1  1  1  1  1  1  1  2  2  2  2  2  2  2  2  2  2\n"
1744            "CGCAUACGC  9 D=112  100   20    1  66.7 30.0 GCGUAUGCG | 2 2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2\n"
1745            "CGGACGGGC  9 E= 80   69   20    1  88.9 34.0 GCCCGUCCG | 2 2  2  2  2  2  2  2  2  2  2  2  2  2  3  3  3  3  3  3\n"
1746            "GGACGGGCC  9 E+  2   70   20    1  88.9 34.0 GGCCCGUCC | 3 3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3\n"
1747            "GACGGGCCU  9 E+  3   71   20    1  77.8 32.0 AGGCCCGUC | 3 3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3\n"
1748            "ACGGGCCUU  9 E+  4   72   20    1  66.7 30.0 AAGGCCCGU | 3 3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3\n"
1749            "UCCUUCGGG  9 B-  1   45   20    1  66.7 30.0 CCCGAAGGA | 2 2  2  2  2  2  2  2  2  2  2  2  3  4  4  4  4  4  4  4\n"
1750            "CGAGCGAUG  9 A-  5   21   20    1  66.7 30.0 CAUCGCUCG | 3 3  3  3  3  3  3  3  3  3  5  5  5  5  5  5  5  5  5  5\n"
1751            "GGGAGCUUG  9 B-  6   40   20    1  66.7 30.0 CAAGCUCCC | 4 4  4  4  4  4  4  4  4  4  4  4  4  4  4  4  4  4  5  5\n"
1752            "GGAGCUUGC  9 B-  5   41   20    1  66.7 30.0 GCAAGCUCC | 4 4  5  5  5  5  5  5  5  5  5  5  5  5  5  5  5  5  5  5\n"
1753            "GCGAUUGGG  9 F=124  111   20    1  66.7 30.0 CCCAAUCGC | 3 3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  6  6\n"
1754            "CGAUUGGGG  9 F+  1  112   20    1  66.7 30.0 CCCCAAUCG | 3 3  3  3  3  3  6  6  6  6  6  6  6  6  6  6  6  6  6  6\n"
1755            "GCUUGCUCC  9 B-  2   44   20    1  66.7 30.0 GGAGCAAGC | 4 4  4  4  4  4  5  5  5  5  5  5  5  7  7  7  7  8  8  8\n"
1756            "UUAGCGGCG  9 E-  7   62   19    1  66.7 30.0 CGCCGCUAA | 4 4  4  4  4  4  4  4  5  5  5  5  5  5  5  6  6  6 11 11\n"
1757            "CCUUCGGGA  9 B+  0   46   18    1  66.7 30.0 UCCCGAAGG | 2 2  3  3  3  3  4  4  4  4  4  4  4  4  4  4  4  5  5 13\n"
1758            "GGAAACGGG  9 C-  5   82   17    1  66.7 30.0 CCCGUUUCC | - -  -  -  -  -  -  -  -  -  -  -  -  -  -  -  3  3  3  3\n"
1759            "GGACGGACG  9 E+  2   70   17    1  77.8 32.0 CGUCCGUCC | 2 2  2  2  2  2  2  2  2  2  2  2  2  2  2  2 10 10 14 14\n"
1760            "GCGGACGGG  9 E-  1   68   17    1  88.9 34.0 CCCGUCCGC | 2 2  2  2  2  2  2  2  2  2  2  2  2  2  2  2 13 13 13 13\n"
1761            "CCGCAUACG  9 D-  1   99   16    1  66.7 30.0 CGUAUGCGG | 2 2  2  2  2  2  2  2  2  2  2  4  4  4  4  5  5  5  5  5\n"
1762            "GGACGUCCG  9 E+  6   74   14    1  77.8 32.0 CGGACGUCC | - -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  3  3  3\n"
1763            "GACGUCCGG  9 E+  7   75   14    1  77.8 32.0 CCGGACGUC | - -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  2  2 14\n"
1764            "ACGUCCGGA  9 E+  8   76   14    1  66.7 30.0 UCCGGACGU | - -  -  -  -  -  -  -  -  -  -  -  -  1  1 11 11 12 12 17\n"
1765            "CGUCCGGAA  9 G= 89   77   14    1  66.7 30.0 UUCCGGACG | - -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  2  2  2\n"
1766            "AACGGGCGC  9 C-  2   85   14    1  77.8 32.0 GCGCCCGUU | - -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  1  1  2\n"
1767            "CGAGCGGAU  9 A-  1   23   13    1  66.7 30.0 AUCCGCUCG | - -  -  -  -  -  -  -  -  -  -  -  3  3  3  3  3  3  3  3\n"
1768            "UUCAGCGGC  9 H= 61   56   13    1  66.7 30.0 GCCGCUGAA | 1 1  1  1  1  1  2  2  2  2  2  2  3  4  4  4  4  4  7  7\n"
1769            "UCGAGCGGA  9 A-  6   21   13    1  66.7 30.0 UCCGCUCGA | 3 3  3  3  3  3  3  3  3  3  3  3  8  8  8  8  8  8  8  8\n"
1770            "ACGGGCGCU  9 C-  1   86   12    1  77.8 32.0 AGCGCCCGU | - -  -  -  -  -  -  -  -  -  -  1  1  1  1  1  1  2  2  2\n"
1771            "AAACGGGCG  9 C-  3   84    9    1  66.7 30.0 CGCCCGUUU | - -  -  -  -  -  -  -  1  1  1  1  1  1  1  1  1  1  1  1\n"
1772            "GACGGACGU  9 E+  3   71    9    1  66.7 30.0 ACGUCCGUC | 2 2  2  2  2  2  2  2 13 13 13 13 13 13 13 14 14 14 14 14\n"
1773            "UCGGGAACG  9 B+  3   49    7    1  66.7 30.0 CGUUCCCGA | - -  -  -  -  -  1  1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1774            "CGGGAACGG  9 B+  4   50    7    1  77.8 32.0 CCGUUCCCG | - -  -  -  -  -  1  1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1775            "GGGAACGGA  9 B+  5   51    7    1  66.7 30.0 UCCGUUCCC | - -  -  -  -  -  1  1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1776            "CGGACGUCC  9 E+  5   73    7    1  77.8 32.0 GGACGUCCG | - -  -  -  -  -  1  1  1  1  1  1  1  3  3  3  3 12 12 12\n"
1777            "GGGCGCUAA  9 C+  1   88    7    1  66.7 30.0 UUAGCGCCC | - -  -  -  -  -  1  1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1778            "ACGGACGUC  9 E+  4   72    7    1  66.7 30.0 GACGUCCGU | - -  -  -  -  -  2  2  3  3  3  4  4  4  4  5  5  5  5 13\n"
1779            "GGGCCUUCC  9 E+  6   74    7    1  77.8 32.0 GGAAGGCCC | - -  -  -  -  -  2  2  2  2  2  3  3  3  3  3  3  3  3  4\n"
1780            "GGCCUUCCG  9 E+  7   75    7    1  77.8 32.0 CGGAAGGCC | - -  -  -  -  -  2  2  2  2  2  3  3  3  3  3  3  3  3  3\n"
1781            "GCCUUCCGA  9 E+  8   76    7    1  66.7 30.0 UCGGAAGGC | - -  -  -  -  -  2  2  2  2  2  3  3  3  3  3  3  3  3  3\n"
1782            "CCGGAAACG  9 C-  7   80    7    1  66.7 30.0 CGUUUCCGG | - -  -  -  -  -  2  2  2  2  2  2  2  6  7  9  9 10 10 10\n"
1783            "CGGAAACGG  9 C-  6   81    7    1  66.7 30.0 CCGUUUCCG | - -  -  -  -  -  2  2  4  4  4  4  4  4  5  5  6  6  6  6\n"
1784            "CGGGCCUUC  9 E+  5   73    7    1  77.8 32.0 GAAGGCCCG | 1 1  1  1  1  1  3  3  3  3  3  3  3  3  3  3  3  3  3  3\n"
1785            "UCAGCGGCG  9 H+  1   57    7    1  77.8 32.0 CGCCGCUGA | 2 2  2  2  2  2  6  6  6  6  6  6  6  6  6  6  7  7  7  7\n"
1786            "CAGCGGCGG  9 H+  2   58    7    1  88.9 34.0 CCGCCGCUG | 2 2  2  2  2  2  6  6  6  6  6  6  6  7 12 12 12 12 12 12\n"
1787            "UAGCGGCGG  9 E-  6   63    7    1  77.8 32.0 CCGCCGCUA | 4 4  4  4  4  4 10 10 10 10 10 10 12 14 14 14 14 14 14 14\n"
1788            "GAAACGGGC  9 C-  4   83    5    1  66.7 30.0 GCCCGUUUC | - -  -  -  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1789            "GCCGUAGGA  9 I=152  138    3    1  66.7 30.0 UCCUACGGC | 1 1  8  8  8  8  8  8  8  8  8  8  9  9  9  9  9  9 12 12\n"
1790            "CCGUAGGAG  9 I+  1  139    3    1  66.7 30.0 CUCCUACGG | 1 1 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 10 11 11\n"
1791            "GUCGAGCGA  9 A-  7   21    3    1  66.7 30.0 UCGCUCGAC | 3 3 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 13\n";
1792
1793        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1794    }
1795
1796#if defined(ARB_64)
1797#define RES_64
1798#else // !defined(ARB_64)
1799// results below differ for some(!) 32 bit arb versions (numeric issues?)
1800// (e.g. u1004 behaves like 64bit version; u1204 doesnt in NDEBUG mode)
1801// #define RES_64 // uncomment for u1004
1802#if defined(DEBUG)
1803#define RES_64
1804#endif
1805
1806#endif
1807
1808
1809    // same as above (with probelen == 8)
1810    {
1811        const char *arguments[] = {
1812            "prgnamefake",
1813            "designnames=CPPParap#PsAAAA00",
1814            "designmintargets=50", // hit at least 1 of the 2 targets
1815            "designmingc=0", "designmaxgc=100", // allow all GCs
1816            "designmintemp=30", "designmaxtemp=100", // allow all temp above 30 deg
1817            // "designmishit=7",
1818            "designmishit=15", // @@@ reports more results than with 7 mishits, but no mishits reported below!
1819            "designprobelength=8",
1820        };
1821
1822        const char *expected =
1823            "Probe design parameters:\n"
1824            "Length of probe    8\n"
1825            "Temperature        [30.0 -100.0]\n"
1826            "GC-content         [ 0.0 -100.0]\n"
1827            "E.Coli position    [any]\n"
1828            "Max. nongroup hits 15\n"
1829            "Min. group hits    50%\n"
1830            "Target   le apos ecol qual grps   G+C temp    Probe | Decrease T by n*.3C -> probe matches n non group species\n"
1831            "GGCGGACG  8 A=78   67   39    2  87.5 30.0 CGUCCGCC | 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13\n"
1832            "GCGGACGG  8 A+ 1   68   39    2  87.5 30.0 CCGUCCGC | 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13\n"
1833            "AGCGGCGG  8 A- 3   64   39    2  87.5 30.0 CCGCCGCU | 11 11 11 11 11 11 11 14 14 14 14 14 14 14 14 14 14 14 14 14\n"
1834            "GCGGCGGA  8 A- 2   65   39    2  87.5 30.0 UCCGCCGC | 10 10 11 11 11 11 11 14 14 14 14 14 14 14 14 14 14 14 14 14\n"
1835            "CGGCGGAC  8 A- 1   66   39    2  87.5 30.0 GUCCGCCG | 10 10 10 10 10 10 10 13 13 13 13 13 13 13 14 14 14 14 14 14\n"
1836            "CGGACGGG  8 A+ 2   69   20    1  87.5 30.0 CCCGUCCG |  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2\n"
1837            "GGACGGGC  8 A+ 4   70   20    1  87.5 30.0 GCCCGUCC |  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3\n"
1838            "GACGGGCC  8 A+ 5   71   20    1  87.5 30.0 GGCCCGUC |  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3\n"
1839#if defined(RES_64)
1840            "ACGGGCGC  8 B=98   86   13    1  87.5 30.0 GCGCCCGU |  -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  1  1  1  1\n"
1841            "CGGGCGCU  8 B+ 1   87   13    1  87.5 30.0 AGCGCCCG |  -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  1  1  1  1\n"
1842            "CAGCGGCG  8 C=63   58    8    1  87.5 30.0 CGCCGCUG |  2  2  2  2  2  2  2  6  6  6  6  6  6  6  8  8  8  8  8  8\n";
1843#else // !defined(RES_64)
1844            "ACGGGCGC  8 B=98   86   13    1  87.5 30.0 GCGCCCGU |  -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  1  1  1  2\n"
1845            "CGGGCGCU  8 B+ 1   87   13    1  87.5 30.0 AGCGCCCG |  -  -  -  -  -  -  -  -  -  -  -  -  1  1  1  1  1  1  1  2\n"
1846            "CAGCGGCG  8 C=63   58    8    1  87.5 30.0 CGCCGCUG |  2  2  2  2  2  2  2  6  6  6  6  6  6  6  8  8  8  8  8 10\n";
1847#endif
1848
1849        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1850    }
1851
1852    // same as above (but restricting ecoli-range)
1853    {
1854        const char *arguments[] = {
1855            "prgnamefake",
1856            "designnames=CPPParap#PsAAAA00",
1857            "designmintargets=50", // hit at least 1 of the 2 targets
1858            "designmingc=0", "designmaxgc=100", // allow all GCs
1859            "designmintemp=30", "designmaxtemp=100", // allow all temp above 30 deg
1860            "designmishit=15",
1861            "designprobelength=8",
1862            "designminpos=65", "designmaxpos=69", // restrict ecoli-range
1863        };
1864
1865        const char *expected =
1866            "Probe design parameters:\n"
1867            "Length of probe    8\n"
1868            "Temperature        [30.0 -100.0]\n"
1869            "GC-content         [ 0.0 -100.0]\n"
1870            "E.Coli position    [  65 -   69]\n"
1871            "Max. nongroup hits 15\n"
1872            "Min. group hits    50%\n"
1873            "Target   le apos ecol qual grps   G+C temp    Probe | Decrease T by n*.3C -> probe matches n non group species\n"
1874            "GGCGGACG  8 A=78   67   39    2  87.5 30.0 CGUCCGCC | 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13\n"
1875            "GCGGACGG  8 A+ 1   68   39    2  87.5 30.0 CCGUCCGC | 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13\n"
1876            "GCGGCGGA  8 A- 2   65   39    2  87.5 30.0 UCCGCCGC | 10 10 11 11 11 11 11 14 14 14 14 14 14 14 14 14 14 14 14 14\n"
1877            "CGGCGGAC  8 A- 1   66   39    2  87.5 30.0 GUCCGCCG | 10 10 10 10 10 10 10 13 13 13 13 13 13 13 14 14 14 14 14 14\n"
1878            "CGGACGGG  8 A+ 2   69   20    1  87.5 30.0 CCCGUCCG |  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2\n";
1879
1880        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1881    }
1882
1883    {
1884        const char *arguments[] = {
1885            "prgnamefake",
1886            "designnames=ClnCorin#CPPParap#ClfPerfr",
1887            "designprobelength=16",
1888            "designmintargets=100",
1889            "designmishit=2",
1890        };
1891        const char *expected =
1892            "Probe design parameters:\n"
1893            "Length of probe    16\n"
1894            "Temperature        [ 0.0 -400.0]\n"
1895            "GC-content         [30.0 - 80.0]\n"
1896            "E.Coli position    [any]\n"
1897            "Max. nongroup hits 2 (lowest rejected nongroup hits: 6)\n"
1898            "Min. group hits    100% (max. rejected coverage: 67%)\n"
1899            "Target           le apos ecol qual grps   G+C temp   Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1900            "CGAAAGGAAGAUUAAU 16 A=94   82   58    3  31.2 42.0 AUUAAUCUUCCUUUCG | 1 1 1 1 1 1 1 1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1901            "AAGGAAGAUUAAUACC 16 A+ 3   85   58    3  31.2 42.0 GGUAUUAAUCUUCCUU | 1 1 1 1 1 1 1 1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1902            "AAGUCGAGCGAUGAAG 16 B=20   19   52    3  50.0 48.0 CUUCAUCGCUCGACUU | 1 1 1 1 1 1 1 1  1  1  1  1  1  1  1  1  1  3  3  3\n"
1903            "CAAGUCGAGCGAUGAA 16 B- 1   18   37    3  50.0 48.0 UUCAUCGCUCGACUUG | 1 1 1 1 1 1 1 1  1  1  1  1  3  3  3  3  3  3  3  3\n"
1904            "GUCGAGCGAUGAAGUU 16 B+ 2   21   31    3  50.0 48.0 AACUUCAUCGCUCGAC | - - - - - - - -  -  -  1  1  1  1  1  1  1  1  1  1\n"
1905            "UCAAGUCGAGCGAUGA 16 B- 2   17   28    3  50.0 48.0 UCAUCGCUCGACUUGA | 1 1 1 1 1 1 1 1  1  3  3  3  3  3  3  3  3  3  3  3\n"
1906            "AGUCGAGCGAUGAAGU 16 B+ 1   20   19    3  50.0 48.0 ACUUCAUCGCUCGACU | - - - - - - 1 1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1907            "AUCAAGUCGAGCGAUG 16 B- 3   16   16    3  50.0 48.0 CAUCGCUCGACUUGAU | 1 1 1 1 1 3 3 3  3  3  3  3  3  3  3  3  3 10 10 10\n"
1908            "GAUCAAGUCGAGCGAU 16 B- 4   15    4    3  50.0 48.0 AUCGCUCGACUUGAUC | - 2 2 2 3 3 3 3 10 10 10 10 10 10 10 10 10 10 10 10\n"
1909            "UGAUCAAGUCGAGCGA 16 B- 5   14    4    3  50.0 48.0 UCGCUCGACUUGAUCA | - 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10\n";
1910
1911        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1912    }
1913    // test same design as above, but add 2 "unknown species" each of which is missing one of the previously designed probes
1914    {
1915        const char *arguments[] = {
1916            "prgnamefake",
1917            "designnames=ClnCorin#Unknown1#CPPParap#ClfPerfr#Unknown2",
1918            "designprobelength=16",
1919            "designmintargets=100",
1920            "designmishit=2",
1921            // pass sequences for the unknown species
1922            "designsequence=---CGAAAGGAAGAUUAAU------------------AAGUCGAGCGAUGAAG-CAAGUCGAGCGAUGAA-GUCGAGCGAUGAAGUU-UCAAGUCGAGCGAUGA-AGUCGAGCGAUGAAGU-AUCAAGUCGAGCGAUG-GAUCAAGUCGAGCGAU-UGAUCAAGUCGAGCGA",
1923            "designsequence=---CGAAAGGAAGAUUAAU-AAGGAAGAUUAAUACC-AAGUCGAGCGAUGAAG-CAAGUCGAGCGAUGAA-GUCGAGCGAUGAAGUU-UCAAGUCGAGCGAUGA-AGUCGAGCGAUGAAGU-AUCAAGUCGAGCGAUG------------------UGAUCAAGUCGAGCGA",
1924        };
1925        const char *expected =
1926            "Probe design parameters:\n"
1927            "Length of probe    16\n"
1928            "Temperature        [ 0.0 -400.0]\n"
1929            "GC-content         [30.0 - 80.0]\n"
1930            "E.Coli position    [any]\n"
1931            "Max. nongroup hits 2\n"
1932            "Min. group hits    100% (max. rejected coverage: 80%)\n"
1933            "Target           le apos ecol qual grps   G+C temp   Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
1934            "CGAAAGGAAGAUUAAU 16 A=94   82   96    5  31.2 42.0 AUUAAUCUUCCUUUCG | 1 1 1 1 1 1 1 1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1935            // AAGGAAGAUUAAUACC is not designed here
1936            "AAGUCGAGCGAUGAAG 16 B=20   19   86    5  50.0 48.0 CUUCAUCGCUCGACUU | 1 1 1 1 1 1 1 1  1  1  1  1  1  1  1  1  1  3  3  3\n"
1937            "CAAGUCGAGCGAUGAA 16 B- 1   18   61    5  50.0 48.0 UUCAUCGCUCGACUUG | 1 1 1 1 1 1 1 1  1  1  1  1  3  3  3  3  3  3  3  3\n"
1938            "GUCGAGCGAUGAAGUU 16 B+ 2   21   51    5  50.0 48.0 AACUUCAUCGCUCGAC | - - - - - - - -  -  -  1  1  1  1  1  1  1  1  1  1\n"
1939            "UCAAGUCGAGCGAUGA 16 B- 2   17   46    5  50.0 48.0 UCAUCGCUCGACUUGA | 1 1 1 1 1 1 1 1  1  3  3  3  3  3  3  3  3  3  3  3\n"
1940            "AGUCGAGCGAUGAAGU 16 B+ 1   20   31    5  50.0 48.0 ACUUCAUCGCUCGACU | - - - - - - 1 1  1  1  1  1  1  1  1  1  1  1  1  1\n"
1941            "AUCAAGUCGAGCGAUG 16 B- 3   16   26    5  50.0 48.0 CAUCGCUCGACUUGAU | 1 1 1 1 1 3 3 3  3  3  3  3  3  3  3  3  3 10 10 10\n"
1942            // GAUCAAGUCGAGCGAU is not designed here
1943            "UGAUCAAGUCGAGCGA 16 B- 5   14    6    5  50.0 48.0 UCGCUCGACUUGAUCA | - 9 9 9 9 9 9 9 10 10 10 10 10 10 10 10 10 10 10 10\n";
1944
1945        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1946    }
1947    {
1948        const char *arguments[] = {
1949            "prgnamefake",
1950            "designnames=VbrFurni",
1951            "designprobelength=8",
1952            "designmingc=80",
1953            "designmaxgc=100",
1954        };
1955        const char *expected =
1956            "Probe design parameters:\n"
1957            "Length of probe    8\n"
1958            "Temperature        [ 0.0 -400.0]\n"
1959            "GC-content         [80.0 -100.0]\n"
1960            "E.Coli position    [any]\n"
1961            "Max. nongroup hits 0 (lowest rejected nongroup hits: 2)\n"
1962            "Min. group hits    50%\n"
1963            "Target   le apos ecol qual grps   G+C temp    Probe | Decrease T by n*.3C -> probe matches n non group species\n"
1964#if defined(RES_64)
1965            "CGGCAGCG  8 A=28   23   20    1  87.5 30.0 CGCUGCCG | - - - - - - - - - - - - - - - - - - - -\n"
1966#else // !defined(RES_64)
1967            "CGGCAGCG  8 A=28   23   20    1  87.5 30.0 CGCUGCCG | - - - - - - - - - - - - - - - - - - - 3\n"
1968#endif
1969            "UGGGCGGC  8 B=67   60    8    1  87.5 30.0 GCCGCCCA | - - - - - - - 1 1 1 1 1 1 1 1 1 1 1 1 1\n"
1970#if defined(RES_64)
1971            "CGGCGAGC  8 B+ 4   60    8    1  87.5 30.0 GCUCGCCG | - - - - - - - 2 2 2 2 2 2 2 3 3 3 3 3 3\n"
1972#else // !defined(RES_64)
1973            "CGGCGAGC  8 B+ 4   60    8    1  87.5 30.0 GCUCGCCG | - - - - - - - 2 2 2 2 2 2 2 4 4 4 4 4 5\n"
1974#endif
1975            "GGGCGGCG  8 B+ 1   60    8    1 100.0 32.0 CGCCGCCC | - - - - - - - 3 3 3 3 3 3 3 3 3 3 3 3 3\n"
1976            "GGCGGCGA  8 B+ 2   60    8    1  87.5 30.0 UCGCCGCC | - - - - - - - 3 3 3 3 3 3 3 3 3 3 3 3 3\n"
1977            "GCGGCGAG  8 B+ 3   60    3    1  87.5 30.0 CUCGCCGC | - - 1 1 1 1 1 4 4 4 4 4 4 4 4 4 4 4 4 4\n";
1978
1979        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
1980    }
1981    {
1982        const char *arguments[] = {
1983            "prgnamefake",
1984            "designnames=HllHalod#VbhChole#VblVulni#VbrFurni#PtVVVulg",
1985            "designprobelength=14",
1986            "designmintargets=100",
1987            "designmishit=4",
1988            "designmingc=70",
1989            "designmaxgc=100",
1990        };
1991        const char *expected =
1992            "Probe design parameters:\n"
1993            "Length of probe    14\n"
1994            "Temperature        [ 0.0 -400.0]\n"
1995            "GC-content         [70.0 -100.0]\n"
1996            "E.Coli position    [any]\n"
1997            "Max. nongroup hits 4\n"
1998            "Min. group hits    100% (max. rejected coverage: 80%)\n"
1999            "Target         le apos ecol qual grps   G+C temp Probe sequence | Decrease T by n*.3C -> probe matches n non group species\n"
2000            "GAGCGGCGGACGGA 14 A=75   64   21    5  78.6 50.0 UCCGUCCGCCGCUC | - - - - 1 1 1 1 1 1 5 5 9 9 10 10 10 10 10 10\n"
2001            "CGAGCGGCGGACGG 14 A- 1   63   21    5  85.7 52.0 CCGUCCGCCGCUCG | - - - - 2 2 2 2 2 2 2 2 2 2  2  2  2  2  9  9\n"
2002            "AGCGGCGGACGGAC 14 A+ 0   64   21    5  78.6 50.0 GUCCGUCCGCCGCU | 4 7 7 7 9 9 9 9 9 9 9 9 9 9  9  9  9 10 10 10\n";
2003
2004        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2005    }
2006    {
2007        const char *arguments[] = {
2008            "prgnamefake",
2009            "designnames=HllHalod#VbhChole#VblVulni#VbrFurni#PtVVVulg",
2010            "designprobelength=14",
2011            "designmintargets=100",
2012            "designmishit=0",
2013            "designmingc=51",
2014            "designmaxgc=60",
2015        };
2016        const char *expected = ""; // no probes found!
2017
2018        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2019    }
2020
2021}
2022
2023void TEST_SLOW_probe_design_errors() {
2024    // test here runs versus database ../UNIT_TESTER/run/TEST_pt_src.arb
2025
2026    bool use_gene_ptserver = false;
2027    {
2028        const char *arguments[] = {
2029            "prgnamefake",
2030            "designnames=CPPParap#PsAAAA00",
2031            "designprobelength=3",
2032        };
2033        const char *expected_error = "Specified min. probe length 3 is below the min. allowed probe length of 8";
2034
2035        TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2036    }
2037    {
2038        const char *arguments[] = {
2039            "prgnamefake",
2040            "designnames=CPPParap#PsAAAA00",
2041            "designprobelength=15",
2042            "designmaxprobelength=12",
2043        };
2044        const char *expected_error = "Max. probe length 12 is below the specified min. probe length of 15";
2045
2046        TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2047    }
2048    {
2049        const char *expected_error = "Sequence contains only 0 bp. Impossible design request for one of the added sequences";
2050        {
2051            const char *arguments[] = {
2052                "prgnamefake",
2053                "designsequence=", // pass an empty sequence
2054                "designprobelength=16",
2055            };
2056            TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2057        }
2058        {
2059            const char *arguments[] = {
2060                "prgnamefake",
2061                "designsequence=-------------", // pass a gap-only sequence
2062                "designprobelength=16",
2063            };
2064            TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2065        }
2066    }
2067    {
2068        const char *arguments[] = {
2069            "prgnamefake",
2070            "designsequence=ACGTACGTACGTACGT", // pass a long enough (unexpected) sequence
2071            "designprobelength=16",
2072        };
2073        const char *expected_error = "Got 0 unknown marked species, but 1 custom sequence was added (has to match)";
2074        TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2075    }
2076    {
2077        const char *arguments[] = {
2078            "prgnamefake",
2079            "designnames=Unknown", // one unknown species
2080            "designprobelength=16",
2081        };
2082        const char *expected_error = "No species marked - no probes designed";
2083        TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2084    }
2085    {
2086        const char *arguments[] = {
2087            "prgnamefake",
2088            "designnames=Unknown#CPPParap", // one unknown species, one known species
2089            "designprobelength=16",
2090        };
2091        const char *expected_error = "Got 1 unknown marked species, but 0 custom sequences were added (has to match)";
2092        TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2093    }
2094    {
2095        const char *expected_error = "Sequence contains only 0 bp. Impossible design request for one of the added sequences";
2096        {
2097            const char *arguments[] = {
2098                "prgnamefake",
2099                "designnames=Unknown", // one unknown species
2100                "designsequence=", // pass an empty sequence
2101                "designprobelength=16",
2102            };
2103            TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2104        }
2105        {
2106            const char *arguments[] = {
2107                "prgnamefake",
2108                "designnames=Unknown", // one unknown species
2109                "designsequence=-------------", // pass a gap-only sequence
2110                "designprobelength=16",
2111            };
2112            TEST_ARB_PROBE__REPORTS_ERROR(ARRAY_ELEMS(arguments), arguments, expected_error);
2113        }
2114    }
2115}
2116
2117void TEST_SLOW_match_designed_probe() {
2118    // test here runs versus database ../UNIT_TESTER/run/TEST_pt_src.arb
2119
2120    bool use_gene_ptserver = false;
2121    const char *arguments[] = {
2122        "prgnamefake",
2123        "matchsequence=UCAAGUCGAGCGAUGAAG",
2124    };
2125    CCP expected = "    name---- fullname mis N_mis wmis pos ecoli rev          'UCAAGUCGAGCGAUGAAG'\1"
2126        "ClnCorin\1" "  ClnCorin            0     0  0.0  18    17 0   .GAGUUUGA-==================-UUCCUUCGG\1"
2127        "CltBotul\1" "  CltBotul            0     0  0.0  18    17 0   ........A-==================-CUUCUUCGG\1"
2128        "CPPParap\1" "  CPPParap            0     0  0.0  18    17 0   AGAGUUUGA-==================-UUCCUUCGG\1"
2129        "ClfPerfr\1" "  ClfPerfr            0     0  0.0  18    17 0   AGAGUUUGA-==================-UUUCCUUCG\1";
2130
2131    TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2132}
2133
2134void TEST_SLOW_get_existing_probes() {
2135    // test here runs versus database ../UNIT_TESTER/run/TEST_pt_src.arb
2136
2137    bool use_gene_ptserver = false;
2138    {
2139        const char *arguments[] = {
2140            "prgnamefake",
2141            "iterate=20",
2142            "iterate_amount=10",
2143        };
2144        CCP expected =
2145            "AAACCGGGGCTAATACCGGA;AAACGACTGTTAATACCGCA;AAACGATGGAAGCTTGCTTC;AAACGATGGCTAATACCGCA;AAACGGATTAGCGGCGGGAC;"
2146            "AAACGGGCGCTAATACCGCA;AAACGGTCGCTAATACCGGA;AAACGGTGGCTAATACCGCA;AAACGTACGCTAATACCGCA;AAACTCAAGCTAATACCGCA";
2147
2148        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2149    }
2150    {
2151        const char *arguments[] = {
2152            "prgnamefake",
2153            "iterate=15",
2154            "iterate_amount=20",
2155            "iterate_separator=:",
2156        };
2157        CCP expected =
2158            "AAACCGGGGCTAATA:AAACGACTGTTAATA:AAACGATGGAAGCTT:AAACGATGGCTAATA:AAACGGATTAGCGGC:AAACGGGCGCTAATA:AAACGGTCGCTAATA:"
2159            "AAACGGTGGCTAATA:AAACGTACGCTAATA:AAACTCAAGCTAATA:AAACTCAGGCTAATA:AAACTGGAGAGTTTG:AAACTGTAGCTAATA:AAACTTGTTTCTCGG:"
2160            "AAAGAGGTGCTAATA:AAAGCTTGCTTTCTT:AAAGGAACGCTAATA:AAAGGAAGATTAATA:AAAGGACAGCTAATA:AAAGGGACTTCGGTC";
2161
2162        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2163    }
2164    {
2165        const char *arguments[] = {
2166            "prgnamefake",
2167            "iterate=10",
2168            "iterate_amount=5",
2169            "iterate_readable=0",
2170        };
2171        CCP expected =
2172            "\2\2\2\3\3\4\4\4\4\3;\2\2\2\3\4\2\3\5\4\5;\2\2\2\3\4\2\5\4\4\2;\2\2\2\3\4\2\5\4\4\3;\2\2\2\3\4\4\2\5\5\2";
2173
2174        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2175    }
2176    {
2177        const char *arguments[] = {
2178            "prgnamefake",
2179            "iterate=3",
2180            "iterate_amount=70",
2181            "iterate_tu=U",
2182        };
2183        CCP expected =
2184            "AAA;AAC;AAG;AAU;ACA;ACC;ACG;ACU;AGA;AGC;AGG;AGU;AUA;AUC;AUG;AUU;"
2185            "CAA;CAC;CAG;CAU;CCA;CCC;CCG;CCU;CGA;CGC;CGG;CGU;CUA;CUC;CUG;CUU;"
2186            "GAA;GAC;GAG;GAU;GCA;GCC;GCG;GCU;GGA;GGC;GGG;GGU;GUA;GUC;GUG;GUU;"
2187            "UAA;UAC;UAG;UAU;UCA;UCC;UCG;UCU;UGA;UGC;UGG;UGU;UUA;UUC;UUG;UUU";
2188
2189        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2190    }
2191    {
2192        const char *arguments[] = {
2193            "prgnamefake",
2194            "iterate=2",
2195            "iterate_amount=20",
2196        };
2197        CCP expected =
2198            "AA;AC;AG;AT;"
2199            "CA;CC;CG;CT;"
2200            "GA;GC;GG;GT;"
2201            "TA;TC;TG;TT";
2202
2203        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, expected);
2204    }
2205}
2206
2207// #define TEST_AUTO_UPDATE // uncomment to auto-update expected index dumps
2208
2209void TEST_SLOW_index_dump() {
2210    for (int use_gene_ptserver = 0; use_gene_ptserver <= 1; use_gene_ptserver++) {
2211        const char *dumpfile     = use_gene_ptserver ? "index_gpt.dump" : "index_pt.dump";
2212        char       *dumpfile_exp = GBS_global_string_copy("%s.expected", dumpfile);
2213
2214        const char *arguments[] = {
2215            "prgnamefake",
2216            GBS_global_string_copy("dump=%s", dumpfile),
2217        };
2218        TEST_ARB_PROBE(ARRAY_ELEMS(arguments), arguments, "ok");
2219
2220#if defined(TEST_AUTO_UPDATE)
2221        TEST_COPY_FILE(dumpfile, dumpfile_exp);
2222#else // !defined(TEST_AUTO_UPDATE)
2223        TEST_EXPECT_TEXTFILES_EQUAL(dumpfile_exp, dumpfile);
2224#endif
2225        TEST_EXPECT_ZERO_OR_SHOW_ERRNO(unlink(dumpfile));
2226
2227        free((char*)arguments[1]);
2228        free(dumpfile_exp);
2229    }
2230}
2231
2232#undef TEST_AUTO_UPDATE
2233
2234// --------------------------------------------------------------------------------
2235
2236#include <arb_strarray.h>
2237#include <set>
2238#include <iterator>
2239
2240using namespace std;
2241
2242typedef set<string> Matches;
2243
2244inline void parseMatches(char*& answer, Matches& matches) {
2245    ConstStrArray match_results;
2246
2247    GBT_splitNdestroy_string(match_results, answer, "\1", false);
2248
2249    for (size_t i = 1; i<match_results.size(); i += 2) {
2250        if (match_results[i][0]) {
2251            matches.insert(match_results[i]);
2252        }
2253    }
2254}
2255
2256inline void getMatches(const char *probe, Matches& matches) {
2257    bool  use_gene_ptserver = false;
2258    char *matchseq          = GBS_global_string_copy("matchsequence=%s", probe);
2259    const char *arguments[] = {
2260        "prgnamefake",
2261        matchseq,
2262    };
2263    TEST_RUN_ARB_PROBE(ARRAY_ELEMS(arguments), arguments);
2264    parseMatches(answer, matches);
2265    free(matchseq);
2266}
2267
2268inline string matches2hitlist(const Matches& matches) {
2269    string hitlist;
2270    if (!matches.empty()) {
2271        for (Matches::const_iterator m = matches.begin(); m != matches.end(); ++m) {
2272            hitlist = hitlist + ',' + *m;
2273        }
2274        hitlist = hitlist.substr(1);
2275    }
2276    return hitlist;
2277}
2278
2279inline void extract_first_but_not_second(const Matches& first, const Matches& second, Matches& result) {
2280    set_difference(first.begin(), first.end(),
2281                   second.begin(), second.end(),
2282                   inserter(result, result.begin()));
2283}
2284
2285// --------------------------------------------------------------------------------
2286
2287// #define TEST_INDEX_COMPLETENESS // only uncomment temporarily (slow as hell)
2288
2289#if defined(TEST_INDEX_COMPLETENESS)
2290
2291void TEST_SLOW_find_unmatched_probes() {
2292    bool use_gene_ptserver = false;
2293
2294    // get all 20mers indexed in ptserver:
2295    ConstStrArray fullProbes;
2296    {
2297        const char *arguments[] = {
2298            "prgnamefake",
2299            "iterate=20",
2300            "iterate_amount=1000000",
2301            "iterate_tu=U",
2302        };
2303        TEST_RUN_ARB_PROBE(ARRAY_ELEMS(arguments), arguments);
2304
2305        GBT_splitNdestroy_string(fullProbes, answer, ";", false);
2306        TEST_EXPECT_EQUAL(fullProbes.size(), 2040);
2307    }
2308
2309    for (size_t lp = 0; lp<fullProbes.size(); ++lp) { // with all 20mers existing in ptserver
2310        const char *fullProbe = fullProbes[lp];
2311
2312        size_t fullLen = strlen(fullProbe);
2313        TEST_EXPECT_EQUAL(fullLen, 20);
2314
2315        Matches fullHits;
2316        getMatches(fullProbe, fullHits);
2317        TEST_EXPECT(fullHits.size()>0);
2318
2319        bool fewerHitsSeen = false;
2320
2321        for (size_t subLen = fullLen-1; !fewerHitsSeen && subLen >= 10; --subLen) { // for each partial sub-probe of 20mer
2322            char subProbe[20];
2323            subProbe[subLen] = 0;
2324
2325            for (size_t pos = 0; pos+subLen <= fullLen; ++pos) {
2326                Matches subHits, onlyFull;
2327
2328                memcpy(subProbe, fullProbe+pos, subLen);
2329                getMatches(subProbe, subHits);
2330                extract_first_but_not_second(fullHits, subHits, onlyFull);
2331
2332                if (!onlyFull.empty()) {
2333                    fprintf(stderr, "TEST_PARTIAL_COVERS_FULL_PROBE__BROKEN(\"%s\", \"%s\");\n", subProbe, fullProbe);
2334                    fewerHitsSeen = true; // only list first wrong hit for each fullProbe
2335                }
2336            }
2337        }
2338    }
2339}
2340
2341#endif
2342// --------------------------------------------------------------------------------
2343
2344static arb_test::match_expectation partial_covers_full_probe(const char *part, const char *full) {
2345    using namespace arb_test;
2346    using namespace std;
2347
2348    expectation_group expected;
2349    expected.add(that(strstr(full, part)).does_differ_from_NULL());
2350    expected.add(that(strlen(part)).is_less_than(strlen(full)));
2351
2352    {
2353        Matches matchFull, matchPart;
2354        getMatches(full,  matchFull);
2355        getMatches(part, matchPart);
2356
2357        expected.add(that(matchFull.empty()).is_equal_to(false));
2358
2359        Matches onlyFirst;
2360        extract_first_but_not_second(matchFull, matchPart, onlyFirst);
2361
2362        string only_hit_by_full = matches2hitlist(onlyFirst);
2363        expected.add(that(only_hit_by_full).is_equal_to(""));
2364    }
2365
2366
2367    return all().ofgroup(expected);
2368}
2369
2370#define TEST_PARTIAL_COVERS_FULL_PROBE(part,full)         TEST_EXPECTATION(partial_covers_full_probe(part, full))
2371#define TEST_PARTIAL_COVERS_FULL_PROBE__BROKEN(part,full) TEST_EXPECTATION__BROKEN(partial_covers_full_probe(part, full))
2372
2373void TEST_SLOW_unmatched_probes() {
2374    TEST_PARTIAL_COVERS_FULL_PROBE("CCUCCUUUCU",          "GAUUAAUACCCCUCCUUUCU");
2375
2376    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUC",          "GGGGAACCUGCGGUUGGAUC");
2377    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCA",         "GGGAACCUGCGGUUGGAUCA");
2378    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCAC",        "GGAACCUGCGGUUGGAUCAC");
2379    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACC",       "GAACCUGCGGUUGGAUCACC");
2380    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACCU",      "AACCUGCGGUUGGAUCACCU");
2381    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACCUC",     "ACCUGCGGUUGGAUCACCUC");
2382    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACCUCC",    "CCUGCGGUUGGAUCACCUCC");
2383    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACCUCCU",   "CUGCGGUUGGAUCACCUCCU");
2384    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACCUCCUU",  "UGCGGUUGGAUCACCUCCUU");
2385    TEST_PARTIAL_COVERS_FULL_PROBE("CGGUUGGAUCACCUCCUUA", "GCGGUUGGAUCACCUCCUUA");
2386
2387    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUC",          "GGGGAACCUGGCGCUGGAUC");
2388    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCA",         "GGGAACCUGGCGCUGGAUCA");
2389    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCAC",        "GGAACCUGGCGCUGGAUCAC");
2390    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACC",       "GAACCUGGCGCUGGAUCACC");
2391    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACCU",      "AACCUGGCGCUGGAUCACCU");
2392    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACCUC",     "ACCUGGCGCUGGAUCACCUC");
2393    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACCUCC",    "CCUGGCGCUGGAUCACCUCC");
2394    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACCUCCU",   "CUGGCGCUGGAUCACCUCCU");
2395    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACCUCCUU",  "UGGCGCUGGAUCACCUCCUU");
2396    TEST_PARTIAL_COVERS_FULL_PROBE("GCGCUGGAUCACCUCCUUU", "GGCGCUGGAUCACCUCCUUU");
2397
2398    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCAC",         "GGAACCUGCGGCUGGAUCAC");
2399    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACC",        "GAACCUGCGGCUGGAUCACC");
2400    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCU",       "AACCUGCGGCUGGAUCACCU");
2401    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCUC",      "ACCUGCGGCUGGAUCACCUC");
2402    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCUCC",     "CCUGCGGCUGGAUCACCUCC");
2403    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCUCCU",    "CUGCGGCUGGAUCACCUCCU");
2404    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCUCCUU",   "UGCGGCUGGAUCACCUCCUU");
2405    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCUCCUUU",  "GCGGCUGGAUCACCUCCUUU");
2406    TEST_PARTIAL_COVERS_FULL_PROBE("GCUGGAUCACCUCCUUUC", "CGGCUGGAUCACCUCCUUUC");
2407
2408    // the data of the following tests is located right in front of the dots inserted in [8962]
2409    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAG",          "AAUUGAAGAGUUUGAUCAAG");
2410    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGU",         "AUUGAAGAGUUUGAUCAAGU");
2411    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUC",        "UUGAAGAGUUUGAUCAAGUC");
2412    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCG",       "UGAAGAGUUUGAUCAAGUCG");
2413    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCGA",      "GAAGAGUUUGAUCAAGUCGA");
2414    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCGAG",     "AAGAGUUUGAUCAAGUCGAG");
2415    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCGAGC",    "AGAGUUUGAUCAAGUCGAGC");
2416    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCGAGCG",   "GAGUUUGAUCAAGUCGAGCG");
2417    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCGAGCGG",  "AGUUUGAUCAAGUCGAGCGG");
2418    TEST_PARTIAL_COVERS_FULL_PROBE("UUUGAUCAAGUCGAGCGGU", "GUUUGAUCAAGUCGAGCGGU");
2419}
2420
2421void TEST_SLOW_variable_defaults_in_server() {
2422    test_setup(false);
2423
2424    const char *server_tag = GBS_ptserver_tag(TEST_SERVER_ID);
2425    TEST_EXPECT_NO_ERROR(arb_look_and_start_server(AISC_MAGIC_NUMBER, server_tag));
2426
2427    const char *servername = GBS_read_arb_tcp(server_tag);
2428    {
2429        char *socketname = GBS_global_string_copy(":%s", GB_path_in_ARBHOME("UNIT_TESTER/sockets/pt.socket"));
2430        TEST_EXPECT_EQUAL(servername, socketname); // as defined in ../lib/arb_tcp.dat@ARB_TEST_PT_SERVER
2431        free(socketname);
2432    }
2433
2434    T_PT_MAIN  com;
2435    T_PT_LOCS  locs;
2436    GB_ERROR   error = NULL;
2437    aisc_com  *link  = aisc_open(servername, com, AISC_MAGIC_NUMBER, &error);
2438    TEST_EXPECT_NO_ERROR(error);
2439    TEST_REJECT_NULL(link);
2440
2441    TEST_EXPECT_ZERO(aisc_create(link, PT_MAIN, com,
2442                                 MAIN_LOCS, PT_LOCS, locs,
2443                                 NULL));
2444
2445    {
2446#define LOCAL(rvar) (prev_read_##rvar)
2447
2448
2449#define FREE_LOCAL_long(rvar)
2450#define FREE_LOCAL_charp(rvar) free(LOCAL(rvar))
2451#define FREE_LOCAL(type,rvar) FREE_LOCAL_##type(rvar)
2452
2453#define TEST__READ(type,rvar,expected)                                  \
2454        do {                                                            \
2455            TEST_EXPECT_ZERO(aisc_get(link, PT_LOCS, locs, rvar, &(LOCAL(rvar)), NULL)); \
2456            TEST_EXPECT_EQUAL(LOCAL(rvar), expected);                   \
2457            FREE_LOCAL(type,rvar);                                      \
2458        } while(0)
2459#define TEST_WRITE(type,rvar,val)                                       \
2460        TEST_EXPECT_ZERO(aisc_put(link, PT_LOCS, locs, rvar, (type)val, NULL))
2461#define TEST_CHANGE(type,rvar,val)              \
2462        do {                                    \
2463            TEST_WRITE(type, rvar, val);        \
2464            TEST__READ(type, rvar, val);        \
2465        } while(0)
2466#define TEST_DEFAULT_CHANGE(ctype,type,remote_variable,default_value,other_value) \
2467        do {                                                            \
2468            ctype DEFAULT_VALUE = default_value;                   \
2469            ctype OTHER_VALUE   = other_value;                     \
2470            type LOCAL(remote_variable);                                \
2471            TEST__READ(type, remote_variable, DEFAULT_VALUE);           \
2472            TEST_CHANGE(type, remote_variable, OTHER_VALUE);            \
2473            TEST_CHANGE(type, remote_variable, DEFAULT_VALUE);          \
2474        } while(0)
2475
2476        TEST_DEFAULT_CHANGE(const long, long, LOCS_MATCH_REVERSED, 1, 67);
2477        typedef char *charp;
2478        typedef const char *ccharp;
2479        TEST_DEFAULT_CHANGE(ccharp, charp, LOCS_LOGINTIME, "notime", "sometime");
2480    }
2481
2482    TEST_EXPECT_ZERO(aisc_close(link, com));
2483    link = 0;
2484}
2485
2486#endif // UNIT_TESTS
Note: See TracBrowser for help on using the repository browser.