source: branches/items/GDE/MAFFT/mafft-7.055-with-extensions/core/blosum.c

Last change on this file was 10371, checked in by aboeckma, 11 years ago

updated mafft version. Added extensions (no svn ignore, yet)

File size: 12.8 KB
Line 
1#define DEFAULTGOP_B -1530
2#define DEFAULTGEP_B   -00
3#define DEFAULTOFS_B  -123   /* +10 -- -50  teido ka ? */
4
5void BLOSUMmtx( int n, double **matrix, double *freq, char *amino, char *amino_grp )
6{
7        /*
8        char locaminod[26] = "GASTPLIMVDNEQFYWKRHCXXX.-U";
9        */
10//      char locaminod[] = "ARNDCQEGHILKMFPSTWYVBZX.-U";
11        char locaminod[] = "ARNDCQEGHILKMFPSTWYVBZX.-J";
12        char locgrpd[] = 
13        {
14                0, 3, 2, 2, 5, 2, 2, 0, 3, 1, 1, 3, 1, 4, 0, 0, 0, 4, 4, 1, 2, 2,
15                6, 6, 6, 1,
16        };
17        double freqd[20] = 
18        {
19            0.077,
20            0.051,
21            0.043,
22            0.052,
23            0.020,
24            0.041,
25            0.062,
26            0.074,
27            0.023,
28            0.052,
29            0.091,
30            0.059,
31            0.024,
32            0.040,
33            0.051,
34            0.069,
35            0.059,
36            0.014,
37            0.032,
38            0.066,
39        };
40
41        double tmpmtx30[] = 
42        {
43    4,
44   -1,     8,
45    0,    -2,     8,
46    0,    -1,     1,     9,
47   -3,    -2,    -1,    -3,    17,
48    1,     3,    -1,    -1,    -2,     8,
49    0,    -1,    -1,     1,     1,     2,     6,
50    0,    -2,     0,    -1,    -4,    -2,    -2,     8,
51   -2,    -1,    -1,    -2,    -5,     0,     0,    -3,    14,
52    0,    -3,     0,    -4,    -2,    -2,    -3,    -1,    -2,     6,
53   -1,    -2,    -2,    -1,     0,    -2,    -1,    -2,    -1,     2,     4,
54    0,     1,     0,     0,    -3,     0,     2,    -1,    -2,    -2,    -2,     4,
55    1,     0,     0,    -3,    -2,    -1,    -1,    -2,     2,     1,     2,     2,     6,
56   -2,    -1,    -1,    -5,    -3,    -3,    -4,    -3,    -3,     0,     2,    -1,    -2,    10,
57   -1,    -1,    -3,    -1,    -3,     0,     1,    -1,     1,    -3,    -3,     1,    -4,    -4,    11,
58    1,    -1,     0,     0,    -2,    -1,     0,     0,    -1,    -1,    -2,     0,    -2,    -1,    -1,     4,
59    1,    -3,     1,    -1,    -2,     0,    -2,    -2,    -2,     0,     0,    -1,     0,    -2,     0,     2,     5,
60   -5,     0,    -7,    -4,    -2,    -1,    -1,     1,    -5,    -3,    -2,    -2,    -3,     1,    -3,    -3,    -5,    20,
61   -4,     0,    -4,    -1,    -6,    -1,    -2,    -3,     0,    -1,     3,    -1,    -1,     3,    -2,    -2,    -1,     5,     9,
62    1,    -1,    -2,    -2,    -2,    -3,    -3,    -3,    -3,     4,     1,    -2,     0,     1,    -4,    -1,     1,    -3,     1,     5,
63    0,    -2,     4,     5,    -2,    -1,     0,     0,    -2,    -2,    -1,     0,    -2,    -3,    -2,     0,     0,    -5,    -3,    -2,     5,
64    0,     0,    -1,     0,     0,     4,     5,    -2,     0,    -3,    -1,     1,    -1,    -4,     0,    -1,    -1,    -1,    -2,    -3,     0,     4,
65    0,    -1,     0,    -1,    -2,     0,    -1,    -1,    -1,     0,     0,     0,     0,    -1,    -1,     0,     0,    -2,    -1,     0,    -1,     0,    -1,
66        };
67       
68        double tmpmtx45[] = 
69        {
70      5,
71     -2,      7,
72     -1,      0,      6,
73     -2,     -1,      2,      7,
74     -1,     -3,     -2,     -3,     12,
75     -1,      1,      0,      0,     -3,      6,
76     -1,      0,      0,      2,     -3,      2,      6,
77      0,     -2,      0,     -1,     -3,     -2,     -2,      7,
78     -2,      0,      1,      0,     -3,      1,      0,     -2,     10,
79     -1,     -3,     -2,     -4,     -3,     -2,     -3,     -4,     -3,      5,
80     -1,     -2,     -3,     -3,     -2,     -2,     -2,     -3,     -2,      2,      5,
81     -1,      3,      0,      0,     -3,      1,      1,     -2,     -1,     -3,     -3,      5,
82     -1,     -1,     -2,     -3,     -2,      0,     -2,     -2,      0,      2,      2,     -1,      6,
83     -2,     -2,     -2,     -4,     -2,     -4,     -3,     -3,     -2,      0,      1,     -3,      0,      8,
84     -1,     -2,     -2,     -1,     -4,     -1,      0,     -2,     -2,     -2,     -3,     -1,     -2,     -3,      9,
85      1,     -1,      1,      0,     -1,      0,      0,      0,     -1,     -2,     -3,     -1,     -2,     -2,     -1,      4,
86      0,     -1,      0,     -1,     -1,     -1,     -1,     -2,     -2,     -1,     -1,     -1,     -1,     -1,     -1,      2,      5,
87     -2,     -2,     -4,     -4,     -5,     -2,     -3,     -2,     -3,     -2,     -2,     -2,     -2,      1,     -3,     -4,     -3,     15,
88     -2,     -1,     -2,     -2,     -3,     -1,     -2,     -3,      2,      0,      0,     -1,      0,      3,     -3,     -2,     -1,      3,      8,
89      0,     -2,     -3,     -3,     -1,     -3,     -3,     -3,     -3,      3,      1,     -2,      1,      0,     -3,     -1,      0,     -3,     -1,      5,
90        };
91    double tmpmtx50[] = 
92    {
93       5,
94      -2,      7,
95      -1,     -1,      7,
96      -2,     -2,      2,      8,
97      -1,     -4,     -2,     -4,     13,
98      -1,      1,      0,      0,     -3,      7,
99      -1,      0,      0,      2,     -3,      2,      6,
100       0,     -3,      0,     -1,     -3,     -2,     -3,      8,
101      -2,      0,      1,     -1,     -3,      1,      0,     -2,     10,
102      -1,     -4,     -3,     -4,     -2,     -3,     -4,     -4,     -4,      5,
103      -2,     -3,     -4,     -4,     -2,     -2,     -3,     -4,     -3,      2,      5,
104      -1,      3,      0,     -1,     -3,      2,      1,     -2,      0,     -3,     -3,      6,
105      -1,     -2,     -2,     -4,     -2,      0,     -2,     -3,     -1,      2,      3,     -2,      7,
106      -3,     -3,     -4,     -5,     -2,     -4,     -3,     -4,     -1,      0,      1,     -4,      0,      8,
107      -1,     -3,     -2,     -1,     -4,     -1,     -1,     -2,     -2,     -3,     -4,     -1,     -3,     -4,     10,
108       1,     -1,      1,      0,     -1,      0,     -1,      0,     -1,     -3,     -3,      0,     -2,     -3,     -1,      5,
109       0,     -1,      0,     -1,     -1,     -1,     -1,     -2,     -2,     -1,     -1,     -1,     -1,     -2,     -1,      2,      5,
110      -3,     -3,     -4,     -5,     -5,     -1,     -3,     -3,     -3,     -3,     -2,     -3,     -1,      1,     -4,     -4,     -3,     15,
111      -2,     -1,     -2,     -3,     -3,     -1,     -2,     -3,      2,     -1,     -1,     -2,      0,      4,     -3,     -2,     -2,      2,      8,
112       0,     -3,     -3,     -4,     -1,     -3,     -3,     -4,     -4,      4,      1,     -3,      1,     -1,     -3,     -2,      0,     -3,     -1,      5,
113    };
114        double tmpmtx62[] = 
115        {
116      6,
117     -2,      8,
118     -2,     -1,      8,
119     -3,     -2,      2,      9,
120     -1,     -5,     -4,     -5,     13,
121     -1,      1,      0,      0,     -4,      8,
122     -1,      0,      0,      2,     -5,      3,      7,
123      0,     -3,     -1,     -2,     -4,     -3,     -3,      8,
124     -2,      0,      1,     -2,     -4,      1,      0,     -3,     11,
125     -2,     -4,     -5,     -5,     -2,     -4,     -5,     -6,     -5,      6,
126     -2,     -3,     -5,     -5,     -2,     -3,     -4,     -5,     -4,      2,      6,
127     -1,      3,      0,     -1,     -5,      2,      1,     -2,     -1,     -4,     -4,      7,
128     -1,     -2,     -3,     -5,     -2,     -1,     -3,     -4,     -2,      2,      3,     -2,      8,
129     -3,     -4,     -4,     -5,     -4,     -5,     -5,     -5,     -2,      0,      1,     -5,      0,      9,
130     -1,     -3,     -3,     -2,     -4,     -2,     -2,     -3,     -3,     -4,     -4,     -2,     -4,     -5,     11,
131      2,     -1,      1,      0,     -1,      0,      0,      0,     -1,     -4,     -4,      0,     -2,     -4,     -1,      6,
132      0,     -2,      0,     -2,     -1,     -1,     -1,     -2,     -3,     -1,     -2,     -1,     -1,     -3,     -2,      2,      7,
133     -4,     -4,     -6,     -6,     -3,     -3,     -4,     -4,     -4,     -4,     -2,     -4,     -2,      1,     -5,     -4,     -4,     16,
134     -3,     -3,     -3,     -5,     -4,     -2,     -3,     -5,      3,     -2,     -2,     -3,     -1,      4,     -4,     -3,     -2,      3,     10,
135      0,     -4,     -4,     -5,     -1,     -3,     -4,     -5,     -5,      4,      1,     -3,      1,     -1,     -4,     -2,      0,     -4,     -2,      6,
136        };
137        double tmpmtx80[] = 
138        {
139      7,
140     -3,      9,
141     -3,     -1,      9,
142     -3,     -3,      2,     10,
143     -1,     -6,     -5,     -7,     13,
144     -2,      1,      0,     -1,     -5,      9,
145     -2,     -1,     -1,      2,     -7,      3,      8,
146      0,     -4,     -1,     -3,     -6,     -4,     -4,      9,
147     -3,      0,      1,     -2,     -7,      1,      0,     -4,     12,
148     -3,     -5,     -6,     -7,     -2,     -5,     -6,     -7,     -6,      7,
149     -3,     -4,     -6,     -7,     -3,     -4,     -6,     -7,     -5,      2,      6,
150     -1,      3,      0,     -2,     -6,      2,      1,     -3,     -1,     -5,     -4,      8,
151     -2,     -3,     -4,     -6,     -3,     -1,     -4,     -5,     -4,      2,      3,     -3,      9,
152     -4,     -5,     -6,     -6,     -4,     -5,     -6,     -6,     -2,     -1,      0,     -5,      0,     10,
153     -1,     -3,     -4,     -3,     -6,     -3,     -2,     -5,     -4,     -5,     -5,     -2,     -4,     -6,     12,
154      2,     -2,      1,     -1,     -2,     -1,     -1,     -1,     -2,     -4,     -4,     -1,     -3,     -4,     -2,      7,
155      0,     -2,      0,     -2,     -2,     -1,     -2,     -3,     -3,     -2,     -3,     -1,     -1,     -4,     -3,      2,      8,
156     -5,     -5,     -7,     -8,     -5,     -4,     -6,     -6,     -4,     -5,     -4,     -6,     -3,      0,     -7,     -6,     -5,     16,
157     -4,     -4,     -4,     -6,     -5,     -3,     -5,     -6,      3,     -3,     -2,     -4,     -3,      4,     -6,     -3,     -3,      3,     11,
158     -1,     -4,     -5,     -6,     -2,     -4,     -4,     -6,     -5,      4,      1,     -4,      1,     -2,     -4,     -3,      0,     -5,     -3,      7,
159        };
160        double tmpmtx0[] = 
161        {
162     2.4,
163    -0.6,    4.7,
164    -0.3,    0.3,    3.8,
165    -0.3,   -0.3,    2.2,    4.7,
166     0.5,   -2.2,   -1.8,   -3.2,   11.5,
167    -0.2,    1.5,    0.7,    0.9,   -2.4,    2.7,
168     0.0,    0.4,    0.9,    2.7,   -3.0,    1.7,    3.6,
169     0.5,   -1.0,    0.4,    0.1,   -2.0,   -1.0,   -0.8,    6.6,
170    -0.8,    0.6,    1.2,    0.4,   -1.3,    1.2,    0.4,   -1.4,    6.0,
171    -0.8,   -2.4,   -2.8,   -3.8,   -1.1,   -1.9,   -2.7,   -4.5,   -2.2,    4.0,
172    -1.2,   -2.2,   -3.0,   -4.0,   -1.5,   -1.6,   -2.8,   -4.4,   -1.9,    2.8,    4.0,
173    -0.4,    2.7,    0.8,    0.5,   -2.8,    1.5,    1.2,   -1.1,    0.6,   -2.1,   -2.1,    3.2,
174    -0.7,   -1.7,   -2.2,   -3.0,   -0.9,   -1.0,   -2.0,   -3.5,   -1.3,    2.5,    2.8,   -1.4,    4.3,
175    -2.3,   -3.2,   -3.1,   -4.5,   -0.8,   -2.6,   -3.9,   -5.2,   -0.1,    1.0,    2.0,   -3.3,    1.6,    7.0,
176     0.3,   -0.9,   -0.9,   -0.7,   -3.1,   -0.2,   -0.5,   -1.6,   -1.1,   -2.6,   -2.3,   -0.6,   -2.4,   -3.8,    7.6,
177     1.1,   -0.2,    0.9,    0.5,    0.1,    0.2,    0.2,    0.4,   -0.2,   -1.8,   -2.1,    0.1,   -1.4,   -2.8,    0.4,    2.2,
178     0.6,   -0.2,    0.5,    0.0,   -0.5,    0.0,   -0.1,   -1.1,   -0.3,   -0.6,   -1.3,    0.1,   -0.6,   -2.2,    0.1,    1.5,    2.5,
179    -3.6,   -1.6,   -3.6,   -5.2,   -1.0,   -2.7,   -4.3,   -4.0,   -0.8,   -1.8,   -0.7,   -3.5,   -1.0,    3.6,   -5.0,   -3.3,   -3.5,   14.2,
180    -2.2,   -1.8,   -1.4,   -2.8,   -0.5,   -1.7,   -2.7,   -4.0,    2.2,   -0.7,    0.0,   -2.1,   -0.2,    5.1,   -3.1,   -1.9,   -1.9,    4.1,    7.8,
181     0.1,   -2.0,   -2.2,   -2.9,    0.0,   -1.5,   -1.9,   -3.3,   -2.0,    3.1,    1.8,   -1.7,    1.6,    0.1,   -1.8,   -1.0,    0.0,   -2.6,   -1.1,    3.4,
182        };
183
184        int i, j, count;
185        double av;
186        double *tmpmtx;
187
188        if( n == 30 ) tmpmtx = tmpmtx30;
189        else if( n == 45 ) tmpmtx = tmpmtx45;
190        else if( n == 50 ) tmpmtx = tmpmtx50;
191        else if( n == 62 ) tmpmtx = tmpmtx62;
192        else if( n == 80 ) tmpmtx = tmpmtx80;
193        else if( n == 0 ) tmpmtx = tmpmtx0;
194        else if( n == -1 ) tmpmtx = loadaamtx();
195        else
196        {
197                fprintf( stderr, "blosum %d ?\n", n );
198                exit( 1 );
199        }
200
201        count = 0;
202        for( i=0; i<20; i++ )
203        {
204                for( j=0; j<=i; j++ )
205                {
206                        matrix[i][j] = matrix[j][i] = (double)tmpmtx[count++];
207                }
208        }
209        if( n == -1 && tmpmtx[400] != -1.0 ) 
210        {
211                for( i=0; i<20; i++ ) freq[i] = tmpmtx[400+i];
212                av = 0.0;
213                for( i=0; i<20; i++ ) av += freq[i];
214                for( i=0; i<20; i++ ) freq[i] /= av;
215        }
216        else
217                for( i=0; i<20; i++ ) freq[i] = freqd[i];
218
219#if 0
220        av = 0.0;
221        for( i=0; i<20; i++ )
222                av += matrix[i][i];
223        av /= 20;
224        fprintf( stdout, "av = %f\n", av );
225
226        for( i=0; i<20; i++ ) for( j=0; j<20; j++ )
227                matrix[i][j] /= av;
228
229        av = wav = 0;
230        count = 0;
231        wcount = 0.0;
232        tmptmp = 0.0;
233        for( i=0; i<20; i++ )
234        {
235                fprintf( stdout, "freq[%d] = %f\n", i, freq[i] );
236                tmptmp += freq[i];
237                for( j=0; j<20; j++ )
238                {
239                        av += matrix[i][j];
240                        wav += freq[i] * freq[j] * matrix[i][j];
241                        count++;
242                        wcount += freq[i] * freq[j];
243                }
244        }
245
246        av /= count;
247        wav /= wcount;
248        fprintf( stdout, "av = %f\n", av );
249        fprintf( stdout, "wav = %f\n", wav );
250        fprintf( stdout, "wcount = %f\n", wcount );
251        fprintf( stdout, "tmptmp = %f\n", tmptmp );
252
253        for( i=0; i<20; i++ )
254        {
255                for( j=0; j<=i; j++ )
256                {
257                        fprintf( stderr, "## %d-%d, %f\n", i, j, matrix[i][j] );
258                }
259        }
260
261        exit( 1 );
262#endif
263
264    for( i=0; i<26; i++ ) amino[i] = locaminod[i];
265    for( i=0; i<26; i++ ) amino_grp[(int)amino[i]] = locgrpd[i];
266}
Note: See TracBrowser for help on using the repository browser.