1 | #define DEFAULTGOP_B -1530 |
---|
2 | #define DEFAULTGEP_B -00 |
---|
3 | #define DEFAULTOFS_B -123 /* +10 -- -50 teido ka ? */ |
---|
4 | |
---|
5 | void BLOSUMmtx( int n, double **matrix, double *freq, char *amino, char *amino_grp ) |
---|
6 | { |
---|
7 | /* |
---|
8 | char locaminod[26] = "GASTPLIMVDNEQFYWKRHCXXX.-U"; |
---|
9 | */ |
---|
10 | // char locaminod[] = "ARNDCQEGHILKMFPSTWYVBZX.-U"; |
---|
11 | char locaminod[] = "ARNDCQEGHILKMFPSTWYVBZX.-J"; |
---|
12 | char locgrpd[] = |
---|
13 | { |
---|
14 | 0, 3, 2, 2, 5, 2, 2, 0, 3, 1, 1, 3, 1, 4, 0, 0, 0, 4, 4, 1, 2, 2, |
---|
15 | 6, 6, 6, 1, |
---|
16 | }; |
---|
17 | double freqd[20] = |
---|
18 | { |
---|
19 | 0.077, |
---|
20 | 0.051, |
---|
21 | 0.043, |
---|
22 | 0.052, |
---|
23 | 0.020, |
---|
24 | 0.041, |
---|
25 | 0.062, |
---|
26 | 0.074, |
---|
27 | 0.023, |
---|
28 | 0.052, |
---|
29 | 0.091, |
---|
30 | 0.059, |
---|
31 | 0.024, |
---|
32 | 0.040, |
---|
33 | 0.051, |
---|
34 | 0.069, |
---|
35 | 0.059, |
---|
36 | 0.014, |
---|
37 | 0.032, |
---|
38 | 0.066, |
---|
39 | }; |
---|
40 | |
---|
41 | double tmpmtx30[] = |
---|
42 | { |
---|
43 | 4, |
---|
44 | -1, 8, |
---|
45 | 0, -2, 8, |
---|
46 | 0, -1, 1, 9, |
---|
47 | -3, -2, -1, -3, 17, |
---|
48 | 1, 3, -1, -1, -2, 8, |
---|
49 | 0, -1, -1, 1, 1, 2, 6, |
---|
50 | 0, -2, 0, -1, -4, -2, -2, 8, |
---|
51 | -2, -1, -1, -2, -5, 0, 0, -3, 14, |
---|
52 | 0, -3, 0, -4, -2, -2, -3, -1, -2, 6, |
---|
53 | -1, -2, -2, -1, 0, -2, -1, -2, -1, 2, 4, |
---|
54 | 0, 1, 0, 0, -3, 0, 2, -1, -2, -2, -2, 4, |
---|
55 | 1, 0, 0, -3, -2, -1, -1, -2, 2, 1, 2, 2, 6, |
---|
56 | -2, -1, -1, -5, -3, -3, -4, -3, -3, 0, 2, -1, -2, 10, |
---|
57 | -1, -1, -3, -1, -3, 0, 1, -1, 1, -3, -3, 1, -4, -4, 11, |
---|
58 | 1, -1, 0, 0, -2, -1, 0, 0, -1, -1, -2, 0, -2, -1, -1, 4, |
---|
59 | 1, -3, 1, -1, -2, 0, -2, -2, -2, 0, 0, -1, 0, -2, 0, 2, 5, |
---|
60 | -5, 0, -7, -4, -2, -1, -1, 1, -5, -3, -2, -2, -3, 1, -3, -3, -5, 20, |
---|
61 | -4, 0, -4, -1, -6, -1, -2, -3, 0, -1, 3, -1, -1, 3, -2, -2, -1, 5, 9, |
---|
62 | 1, -1, -2, -2, -2, -3, -3, -3, -3, 4, 1, -2, 0, 1, -4, -1, 1, -3, 1, 5, |
---|
63 | 0, -2, 4, 5, -2, -1, 0, 0, -2, -2, -1, 0, -2, -3, -2, 0, 0, -5, -3, -2, 5, |
---|
64 | 0, 0, -1, 0, 0, 4, 5, -2, 0, -3, -1, 1, -1, -4, 0, -1, -1, -1, -2, -3, 0, 4, |
---|
65 | 0, -1, 0, -1, -2, 0, -1, -1, -1, 0, 0, 0, 0, -1, -1, 0, 0, -2, -1, 0, -1, 0, -1, |
---|
66 | }; |
---|
67 | |
---|
68 | double tmpmtx45[] = |
---|
69 | { |
---|
70 | 5, |
---|
71 | -2, 7, |
---|
72 | -1, 0, 6, |
---|
73 | -2, -1, 2, 7, |
---|
74 | -1, -3, -2, -3, 12, |
---|
75 | -1, 1, 0, 0, -3, 6, |
---|
76 | -1, 0, 0, 2, -3, 2, 6, |
---|
77 | 0, -2, 0, -1, -3, -2, -2, 7, |
---|
78 | -2, 0, 1, 0, -3, 1, 0, -2, 10, |
---|
79 | -1, -3, -2, -4, -3, -2, -3, -4, -3, 5, |
---|
80 | -1, -2, -3, -3, -2, -2, -2, -3, -2, 2, 5, |
---|
81 | -1, 3, 0, 0, -3, 1, 1, -2, -1, -3, -3, 5, |
---|
82 | -1, -1, -2, -3, -2, 0, -2, -2, 0, 2, 2, -1, 6, |
---|
83 | -2, -2, -2, -4, -2, -4, -3, -3, -2, 0, 1, -3, 0, 8, |
---|
84 | -1, -2, -2, -1, -4, -1, 0, -2, -2, -2, -3, -1, -2, -3, 9, |
---|
85 | 1, -1, 1, 0, -1, 0, 0, 0, -1, -2, -3, -1, -2, -2, -1, 4, |
---|
86 | 0, -1, 0, -1, -1, -1, -1, -2, -2, -1, -1, -1, -1, -1, -1, 2, 5, |
---|
87 | -2, -2, -4, -4, -5, -2, -3, -2, -3, -2, -2, -2, -2, 1, -3, -4, -3, 15, |
---|
88 | -2, -1, -2, -2, -3, -1, -2, -3, 2, 0, 0, -1, 0, 3, -3, -2, -1, 3, 8, |
---|
89 | 0, -2, -3, -3, -1, -3, -3, -3, -3, 3, 1, -2, 1, 0, -3, -1, 0, -3, -1, 5, |
---|
90 | }; |
---|
91 | double tmpmtx50[] = |
---|
92 | { |
---|
93 | 5, |
---|
94 | -2, 7, |
---|
95 | -1, -1, 7, |
---|
96 | -2, -2, 2, 8, |
---|
97 | -1, -4, -2, -4, 13, |
---|
98 | -1, 1, 0, 0, -3, 7, |
---|
99 | -1, 0, 0, 2, -3, 2, 6, |
---|
100 | 0, -3, 0, -1, -3, -2, -3, 8, |
---|
101 | -2, 0, 1, -1, -3, 1, 0, -2, 10, |
---|
102 | -1, -4, -3, -4, -2, -3, -4, -4, -4, 5, |
---|
103 | -2, -3, -4, -4, -2, -2, -3, -4, -3, 2, 5, |
---|
104 | -1, 3, 0, -1, -3, 2, 1, -2, 0, -3, -3, 6, |
---|
105 | -1, -2, -2, -4, -2, 0, -2, -3, -1, 2, 3, -2, 7, |
---|
106 | -3, -3, -4, -5, -2, -4, -3, -4, -1, 0, 1, -4, 0, 8, |
---|
107 | -1, -3, -2, -1, -4, -1, -1, -2, -2, -3, -4, -1, -3, -4, 10, |
---|
108 | 1, -1, 1, 0, -1, 0, -1, 0, -1, -3, -3, 0, -2, -3, -1, 5, |
---|
109 | 0, -1, 0, -1, -1, -1, -1, -2, -2, -1, -1, -1, -1, -2, -1, 2, 5, |
---|
110 | -3, -3, -4, -5, -5, -1, -3, -3, -3, -3, -2, -3, -1, 1, -4, -4, -3, 15, |
---|
111 | -2, -1, -2, -3, -3, -1, -2, -3, 2, -1, -1, -2, 0, 4, -3, -2, -2, 2, 8, |
---|
112 | 0, -3, -3, -4, -1, -3, -3, -4, -4, 4, 1, -3, 1, -1, -3, -2, 0, -3, -1, 5, |
---|
113 | }; |
---|
114 | double tmpmtx62[] = |
---|
115 | { |
---|
116 | 6, |
---|
117 | -2, 8, |
---|
118 | -2, -1, 8, |
---|
119 | -3, -2, 2, 9, |
---|
120 | -1, -5, -4, -5, 13, |
---|
121 | -1, 1, 0, 0, -4, 8, |
---|
122 | -1, 0, 0, 2, -5, 3, 7, |
---|
123 | 0, -3, -1, -2, -4, -3, -3, 8, |
---|
124 | -2, 0, 1, -2, -4, 1, 0, -3, 11, |
---|
125 | -2, -4, -5, -5, -2, -4, -5, -6, -5, 6, |
---|
126 | -2, -3, -5, -5, -2, -3, -4, -5, -4, 2, 6, |
---|
127 | -1, 3, 0, -1, -5, 2, 1, -2, -1, -4, -4, 7, |
---|
128 | -1, -2, -3, -5, -2, -1, -3, -4, -2, 2, 3, -2, 8, |
---|
129 | -3, -4, -4, -5, -4, -5, -5, -5, -2, 0, 1, -5, 0, 9, |
---|
130 | -1, -3, -3, -2, -4, -2, -2, -3, -3, -4, -4, -2, -4, -5, 11, |
---|
131 | 2, -1, 1, 0, -1, 0, 0, 0, -1, -4, -4, 0, -2, -4, -1, 6, |
---|
132 | 0, -2, 0, -2, -1, -1, -1, -2, -3, -1, -2, -1, -1, -3, -2, 2, 7, |
---|
133 | -4, -4, -6, -6, -3, -3, -4, -4, -4, -4, -2, -4, -2, 1, -5, -4, -4, 16, |
---|
134 | -3, -3, -3, -5, -4, -2, -3, -5, 3, -2, -2, -3, -1, 4, -4, -3, -2, 3, 10, |
---|
135 | 0, -4, -4, -5, -1, -3, -4, -5, -5, 4, 1, -3, 1, -1, -4, -2, 0, -4, -2, 6, |
---|
136 | }; |
---|
137 | double tmpmtx80[] = |
---|
138 | { |
---|
139 | 7, |
---|
140 | -3, 9, |
---|
141 | -3, -1, 9, |
---|
142 | -3, -3, 2, 10, |
---|
143 | -1, -6, -5, -7, 13, |
---|
144 | -2, 1, 0, -1, -5, 9, |
---|
145 | -2, -1, -1, 2, -7, 3, 8, |
---|
146 | 0, -4, -1, -3, -6, -4, -4, 9, |
---|
147 | -3, 0, 1, -2, -7, 1, 0, -4, 12, |
---|
148 | -3, -5, -6, -7, -2, -5, -6, -7, -6, 7, |
---|
149 | -3, -4, -6, -7, -3, -4, -6, -7, -5, 2, 6, |
---|
150 | -1, 3, 0, -2, -6, 2, 1, -3, -1, -5, -4, 8, |
---|
151 | -2, -3, -4, -6, -3, -1, -4, -5, -4, 2, 3, -3, 9, |
---|
152 | -4, -5, -6, -6, -4, -5, -6, -6, -2, -1, 0, -5, 0, 10, |
---|
153 | -1, -3, -4, -3, -6, -3, -2, -5, -4, -5, -5, -2, -4, -6, 12, |
---|
154 | 2, -2, 1, -1, -2, -1, -1, -1, -2, -4, -4, -1, -3, -4, -2, 7, |
---|
155 | 0, -2, 0, -2, -2, -1, -2, -3, -3, -2, -3, -1, -1, -4, -3, 2, 8, |
---|
156 | -5, -5, -7, -8, -5, -4, -6, -6, -4, -5, -4, -6, -3, 0, -7, -6, -5, 16, |
---|
157 | -4, -4, -4, -6, -5, -3, -5, -6, 3, -3, -2, -4, -3, 4, -6, -3, -3, 3, 11, |
---|
158 | -1, -4, -5, -6, -2, -4, -4, -6, -5, 4, 1, -4, 1, -2, -4, -3, 0, -5, -3, 7, |
---|
159 | }; |
---|
160 | double tmpmtx0[] = |
---|
161 | { |
---|
162 | 2.4, |
---|
163 | -0.6, 4.7, |
---|
164 | -0.3, 0.3, 3.8, |
---|
165 | -0.3, -0.3, 2.2, 4.7, |
---|
166 | 0.5, -2.2, -1.8, -3.2, 11.5, |
---|
167 | -0.2, 1.5, 0.7, 0.9, -2.4, 2.7, |
---|
168 | 0.0, 0.4, 0.9, 2.7, -3.0, 1.7, 3.6, |
---|
169 | 0.5, -1.0, 0.4, 0.1, -2.0, -1.0, -0.8, 6.6, |
---|
170 | -0.8, 0.6, 1.2, 0.4, -1.3, 1.2, 0.4, -1.4, 6.0, |
---|
171 | -0.8, -2.4, -2.8, -3.8, -1.1, -1.9, -2.7, -4.5, -2.2, 4.0, |
---|
172 | -1.2, -2.2, -3.0, -4.0, -1.5, -1.6, -2.8, -4.4, -1.9, 2.8, 4.0, |
---|
173 | -0.4, 2.7, 0.8, 0.5, -2.8, 1.5, 1.2, -1.1, 0.6, -2.1, -2.1, 3.2, |
---|
174 | -0.7, -1.7, -2.2, -3.0, -0.9, -1.0, -2.0, -3.5, -1.3, 2.5, 2.8, -1.4, 4.3, |
---|
175 | -2.3, -3.2, -3.1, -4.5, -0.8, -2.6, -3.9, -5.2, -0.1, 1.0, 2.0, -3.3, 1.6, 7.0, |
---|
176 | 0.3, -0.9, -0.9, -0.7, -3.1, -0.2, -0.5, -1.6, -1.1, -2.6, -2.3, -0.6, -2.4, -3.8, 7.6, |
---|
177 | 1.1, -0.2, 0.9, 0.5, 0.1, 0.2, 0.2, 0.4, -0.2, -1.8, -2.1, 0.1, -1.4, -2.8, 0.4, 2.2, |
---|
178 | 0.6, -0.2, 0.5, 0.0, -0.5, 0.0, -0.1, -1.1, -0.3, -0.6, -1.3, 0.1, -0.6, -2.2, 0.1, 1.5, 2.5, |
---|
179 | -3.6, -1.6, -3.6, -5.2, -1.0, -2.7, -4.3, -4.0, -0.8, -1.8, -0.7, -3.5, -1.0, 3.6, -5.0, -3.3, -3.5, 14.2, |
---|
180 | -2.2, -1.8, -1.4, -2.8, -0.5, -1.7, -2.7, -4.0, 2.2, -0.7, 0.0, -2.1, -0.2, 5.1, -3.1, -1.9, -1.9, 4.1, 7.8, |
---|
181 | 0.1, -2.0, -2.2, -2.9, 0.0, -1.5, -1.9, -3.3, -2.0, 3.1, 1.8, -1.7, 1.6, 0.1, -1.8, -1.0, 0.0, -2.6, -1.1, 3.4, |
---|
182 | }; |
---|
183 | |
---|
184 | int i, j, count; |
---|
185 | double av; |
---|
186 | double *tmpmtx; |
---|
187 | |
---|
188 | if( n == 30 ) tmpmtx = tmpmtx30; |
---|
189 | else if( n == 45 ) tmpmtx = tmpmtx45; |
---|
190 | else if( n == 50 ) tmpmtx = tmpmtx50; |
---|
191 | else if( n == 62 ) tmpmtx = tmpmtx62; |
---|
192 | else if( n == 80 ) tmpmtx = tmpmtx80; |
---|
193 | else if( n == 0 ) tmpmtx = tmpmtx0; |
---|
194 | else if( n == -1 ) tmpmtx = loadaamtx(); |
---|
195 | else |
---|
196 | { |
---|
197 | fprintf( stderr, "blosum %d ?\n", n ); |
---|
198 | exit( 1 ); |
---|
199 | } |
---|
200 | |
---|
201 | count = 0; |
---|
202 | for( i=0; i<20; i++ ) |
---|
203 | { |
---|
204 | for( j=0; j<=i; j++ ) |
---|
205 | { |
---|
206 | matrix[i][j] = matrix[j][i] = (double)tmpmtx[count++]; |
---|
207 | } |
---|
208 | } |
---|
209 | if( n == -1 && tmpmtx[400] != -1.0 ) |
---|
210 | { |
---|
211 | for( i=0; i<20; i++ ) freq[i] = tmpmtx[400+i]; |
---|
212 | av = 0.0; |
---|
213 | for( i=0; i<20; i++ ) av += freq[i]; |
---|
214 | for( i=0; i<20; i++ ) freq[i] /= av; |
---|
215 | } |
---|
216 | else |
---|
217 | for( i=0; i<20; i++ ) freq[i] = freqd[i]; |
---|
218 | |
---|
219 | #if 0 |
---|
220 | av = 0.0; |
---|
221 | for( i=0; i<20; i++ ) |
---|
222 | av += matrix[i][i]; |
---|
223 | av /= 20; |
---|
224 | fprintf( stdout, "av = %f\n", av ); |
---|
225 | |
---|
226 | for( i=0; i<20; i++ ) for( j=0; j<20; j++ ) |
---|
227 | matrix[i][j] /= av; |
---|
228 | |
---|
229 | av = wav = 0; |
---|
230 | count = 0; |
---|
231 | wcount = 0.0; |
---|
232 | tmptmp = 0.0; |
---|
233 | for( i=0; i<20; i++ ) |
---|
234 | { |
---|
235 | fprintf( stdout, "freq[%d] = %f\n", i, freq[i] ); |
---|
236 | tmptmp += freq[i]; |
---|
237 | for( j=0; j<20; j++ ) |
---|
238 | { |
---|
239 | av += matrix[i][j]; |
---|
240 | wav += freq[i] * freq[j] * matrix[i][j]; |
---|
241 | count++; |
---|
242 | wcount += freq[i] * freq[j]; |
---|
243 | } |
---|
244 | } |
---|
245 | |
---|
246 | av /= count; |
---|
247 | wav /= wcount; |
---|
248 | fprintf( stdout, "av = %f\n", av ); |
---|
249 | fprintf( stdout, "wav = %f\n", wav ); |
---|
250 | fprintf( stdout, "wcount = %f\n", wcount ); |
---|
251 | fprintf( stdout, "tmptmp = %f\n", tmptmp ); |
---|
252 | |
---|
253 | for( i=0; i<20; i++ ) |
---|
254 | { |
---|
255 | for( j=0; j<=i; j++ ) |
---|
256 | { |
---|
257 | fprintf( stderr, "## %d-%d, %f\n", i, j, matrix[i][j] ); |
---|
258 | } |
---|
259 | } |
---|
260 | |
---|
261 | exit( 1 ); |
---|
262 | #endif |
---|
263 | |
---|
264 | for( i=0; i<26; i++ ) amino[i] = locaminod[i]; |
---|
265 | for( i=0; i<26; i++ ) amino_grp[(int)amino[i]] = locgrpd[i]; |
---|
266 | } |
---|