source: branches/profile/lib/import/nonformats/longgenbank.ift

Last change on this file was 6092, checked in by westram, 15 years ago
  • import filters mostly SILVA compatible (thx to Frank Oliver)
  • moved feature-table into separate filter which is included by longebi.ift and longgenbank.ift
  • added AUTOTAGging (commented out)
  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
File size: 5.0 KB
Line 
1AUTODETECT      "LOCUS       *\nORIGIN*"
2
3KEYWIDTH        12
4FILETAG         GB
5
6BEGIN           "LOCUS*"
7
8# set variables used by feature table
9SETGLOBAL       t GB
10SETGLOBAL       u gb
11
12# uncomment next line to tag ALL fields with [GB]
13# AUTOTAG "GB"
14
15
16MATCH           "LOCUS *"
17                SRT             "* *=*1"
18                WRITE           "name"
19
20MATCH           "LOCUS *"
21                SRT             "* *=*1"
22                TAG             "GB"
23                WRITE           "id"
24
25#MATCH           "LOCUS *"
26#                SRT             "     = :    = :   = :  = :* * *=*2"
27#                TAG             "GB"
28#                WRITE           "db_nuc"
29
30MATCH           "ACCESSION *"
31                ACI             "extract_words("0123456789",2.0)"
32                WRITE           "acc"
33
34#MATCH           "ACCESSION *"
35#                ACI             "extract_words("0123456789",4.0)"
36#                TAG             "GB"
37#                WRITE           "db_acc"
38
39MATCH           "PROJECT"
40#                TAG             "GB"
41                WRITE_INT        "insdc"
42
43MATCH           "LOCUS *"
44                SRT             "     = :    = :   = :  = :* * * * * * *=*7"
45#                TAG             "GB"
46                WRITE           "date"
47
48MATCH           "DEFINITION"
49#                TAG             "GB"
50                WRITE           "description"
51
52MATCH           "KEYWORDS *"
53#                TAG             "GB"
54                APPEND          "keywords"
55
56MATCH           "  ORGANISM *"
57                SRT             "* * *=*1 *2:*|*=*1"
58                WRITE           "full_name"
59
60MATCH           "  ORGANISM *"
61#                TAG             "GB"
62                SRT             "*|*=*1"
63                WRITE           "tax_gb_name"
64
65MATCH           "  ORGANISM *"
66#                TAG             "GB"
67                SRT             "*|*=*2"
68                WRITE           "tax_gb"
69
70MATCH           "REFERENCE *"
71                SRT             "* *=*1"
72                SETVAR          x
73                IFNOTSET        x "No REFERENCE seen"
74#                TAG             "GB"
75#                APPEND          "num_bib"
76
77MATCH           "REFERENCE *"
78                SRT             "*(*=*2:bases=:to=-: =:)=:*=[$x]\: *"
79#                TAG             "GB"
80                APPEND          "nuc_rp"
81
82MATCH           "  MEDLINE *"
83#                SRT             "*=[$x]\: *"
84#                TAG             "GB"
85                APPEND          "medline_id"
86
87MATCH           "   PUBMED *"
88#                SRT             "*=[$x]\: *"
89#                TAG             "GB"
90                APPEND          "pubmed_id"
91
92MATCH           "  CONSRTM *"
93                SRT             "*=[$x]\: *"
94                TAG             "GB"
95                APPEND          "refgrp"
96               
97MATCH           "  AUTHORS *"
98                SRT             "*=[$x]\: *"
99#                TAG             "GB"
100                APPEND          "author"
101
102MATCH           "  TITLE *"
103                SRT             "*=[$x]\: *"
104#                TAG             "GB"
105                APPEND          "title"
106
107MATCH           "  JOURNAL *"
108                SRT             "*=[$x]\: *"
109#                TAG             "GB"
110                APPEND          "journal"
111
112MATCH           "  JOURNAL *Submitted*"
113                SRT             "*Submitted*=*2:\(*\)*=*1"
114#                TAG             "GB"
115                WRITE           "submit_date"
116
117MATCH           "     Protein*note*"
118                SRT             "*/note\=\"*\"*=*2"
119                TAG             "GB"
120                APPEND          "note"
121
122#MATCH           "     Protein*EC_number*"
123#                SRT             "*/EC_number\=\"*\"*=*2"
124#                TAG             "GB"
125#                APPEND          "EC_number"
126
127#MATCH           "     Protein*product=*"
128#                SRT             "*/product\=\"*\"*=*2"
129#                TAG             "GB"
130#                APPEND          "gene_prod"
131
132# maybe works with FT prefix (untested):
133# (@@@ put into feature table when tested)
134#MATCH           "FTx*Protein*note*"
135#                SRT             "*/note\=\"*\"*=*2"
136#                TAG             "GB"
137#                APPEND          "description"
138#MATCH           "FTx*Protein*EC_number*"
139#                SRT             "*/EC_number\=\"*\"*=*2"
140#                TAG             "GB"
141#                APPEND          "EC_number"
142#MATCH           "FTx*Protein*product=*"
143#                SRT             "*/product\=\"*\"*=*2"
144#                TAG             "GB"
145#                APPEND          "gene_prod"
146
147# -----------------------------------------------------------------
148# Feature table (used by longebi.ift and longgenbank.ift!)
149
150INCLUDE         "feature_table.ift"
151
152# ---------------------------------------------------------------
153
154SEQUENCEAFTER   "ORIGIN*"
155SEQUENCESRT     " =:~=.:*Check*..="
156SEQUENCEACI     "remove("0123456789 /")"
157SEQUENCECOLUMN  0
158SEQUENCEEND     "//"
159
160CREATE_ACC_FROM_SEQUENCE
161
162END             "//"
Note: See TracBrowser for help on using the repository browser.