source: tags/ms_ra2q2/CONVERTALN/genbank.h

Last change on this file was 15513, checked in by westram, 8 years ago
File size: 2.9 KB
Line 
1#ifndef GENBANK_H
2#define GENBANK_H
3
4#ifndef REFS_H
5#include "refs.h"
6#endif
7#ifndef PARSER_H
8#include "parser.h"
9#endif
10#ifndef ARB_STRING_H
11#include <arb_string.h>
12#endif
13
14struct GenbankRef {
15    char *ref;
16    char *author;
17    char *title;
18    char *journal;
19    char *standard;
20
21    GenbankRef()
22        : ref(no_content()),
23          author(no_content()),
24          title(no_content()),
25          journal(no_content()),
26          standard(no_content())
27    {}
28    GenbankRef(const GenbankRef& other)
29        : ref(ARB_strdup(other.ref)),
30          author(ARB_strdup(other.author)),
31          title(ARB_strdup(other.title)),
32          journal(ARB_strdup(other.journal)),
33          standard(ARB_strdup(other.standard))
34    {}
35    ~GenbankRef() {
36        free(standard);
37        free(journal);
38        free(title);
39        free(author);
40        free(ref);
41    }
42    DECLARE_ASSIGNMENT_OPERATOR(GenbankRef);
43};
44
45class GenBank FINAL_TYPE : public InputFormat, public RefContainer<GenbankRef> { // derived from a Noncopyable
46    char *create_id() const OVERRIDE {
47        char buf[TOKENSIZE];
48        genbank_key_word(locus, 0, buf);
49        return ARB_strdup(buf);
50    }
51public:
52    char *locus;
53    char *definition;
54    char *accession;
55    char *keywords;
56    char *source;
57    char *organism;
58
59    RDP_comments comments;
60
61    GenBank() {
62        locus      = no_content();
63        definition = no_content();
64        accession  = no_content();
65        keywords   = no_content();
66        source     = no_content();
67        organism   = no_content();
68    }
69    ~GenBank() OVERRIDE {
70        freenull(locus);
71        freenull(definition);
72        freenull(accession);
73        freenull(keywords);
74        freenull(source);
75        freenull(organism);
76    }
77
78    bool locus_contains_date() const { return str0len(locus) >= 60; }
79
80    char *get_date() const {
81        if (locus_contains_date()) return strndup(locus+50, 11);
82        return ARB_strdup(genbank_date(today_date()));
83    }
84
85    // InputFormat interface
86    void reinit() OVERRIDE { INPLACE_RECONSTRUCT(GenBank, this); }
87    Format format() const OVERRIDE { return GENBANK; }
88};
89
90class GenbankReader : public SimpleFormatReader {
91    GenBank data;
92public:
93    GenbankReader(const char *inf) : SimpleFormatReader(inf) {}
94
95    const char *get_key_word(int offset) {
96        char key[TOKENSIZE];
97        genbank_key_word(line() + offset, 0, key);
98        return shorttimecopy(key);
99    }
100    bool read_one_entry(Seq& seq) OVERRIDE __ATTR__USERESULT;
101    InputFormat& get_data() OVERRIDE { return data; }
102};
103
104// ----------------------
105//      GenbankParser
106
107class GenbankParser : public Parser {
108    GenBank& gbk;
109
110    void parse_keyed_section(const char *key);
111public:
112    GenbankParser(GenBank& gbk_, Seq& seq_, GenbankReader& reader_) : Parser(seq_, reader_), gbk(gbk_) {}
113    void parse_section() OVERRIDE;
114
115    const GenBank& get_data() const OVERRIDE { return gbk; }
116};
117
118#else
119#error genbank.h included twice
120#endif // GENBANK_H
Note: See TracBrowser for help on using the repository browser.