source: tags/testbuild/DIST/di_matr.hxx

Last change on this file was 12959, checked in by westram, 11 years ago
  • remove strlen from loop-condition
  • assert correct matrix types in calculate, calculate_pro + calculate_overall_freqs
  • Property svn:eol-style set to native
  • Property svn:keywords set to Author Date Id Revision
File size: 7.1 KB
Line 
1// =============================================================== //
2//                                                                 //
3//   File      : di_matr.hxx                                       //
4//   Purpose   :                                                   //
5//                                                                 //
6//   Institute of Microbiology (Technical University Munich)       //
7//   http://www.arb-home.de/                                       //
8//                                                                 //
9// =============================================================== //
10
11#ifndef DI_MATR_HXX
12#define DI_MATR_HXX
13
14#ifndef AP_PRO_A_NUCS_HXX
15#include <AP_pro_a_nucs.hxx>
16#endif
17#ifndef AP_TREE_HXX
18#include <AP_Tree.hxx>
19#endif
20#ifndef AP_MATRIX_HXX
21#include <AP_matrix.hxx>
22#endif
23#ifndef _GLIBCXX_STRING
24#include <string>
25#endif
26
27#define di_assert(cond) arb_assert(cond)
28
29#define AWAR_DIST_PREFIX           "dist/"
30#define AWAR_DIST_CORR_TRANS       AWAR_DIST_PREFIX "correction/trans"
31#define AWAR_DIST_SAVE_MATRIX_BASE "tmp/" AWAR_DIST_PREFIX "save_matrix"
32
33#define AWAR_DIST_DIST_PREFIX AWAR_DIST_PREFIX "dist/"
34#define AWAR_DIST_MIN_DIST    AWAR_DIST_DIST_PREFIX "lower"
35#define AWAR_DIST_MAX_DIST    AWAR_DIST_DIST_PREFIX "upper"
36
37enum DI_TRANSFORMATION {
38    DI_TRANSFORMATION_NONE,
39    DI_TRANSFORMATION_SIMILARITY,
40    DI_TRANSFORMATION_JUKES_CANTOR,
41    DI_TRANSFORMATION_FELSENSTEIN,
42
43    DI_TRANSFORMATION_PAM,
44    DI_TRANSFORMATION_CATEGORIES_HALL,
45    DI_TRANSFORMATION_CATEGORIES_BARKER,
46    DI_TRANSFORMATION_CATEGORIES_CHEMICAL,
47
48    DI_TRANSFORMATION_KIMURA,
49    DI_TRANSFORMATION_OLSEN,
50    DI_TRANSFORMATION_FELSENSTEIN_VOIGT,
51    DI_TRANSFORMATION_OLSEN_VOIGT,
52    DI_TRANSFORMATION_ML,
53
54    DI_TRANSFORMATION_FROM_TREE,
55
56    // -------------------- real transformations are above
57
58    DI_TRANSFORMATION_COUNT,         // amount of real transformations
59    DI_TRANSFORMATION_NONE_DETECTED, // nothing was auto-detected
60};
61
62enum DI_MATRIX_TYPE {
63    DI_MATRIX_FULL,
64    DI_MATRIX_COMPRESSED
65};
66
67class AP_sequence_parsimony;
68class AP_sequence_simple_protein;
69class DI_MATRIX;
70
71class DI_ENTRY : virtual Noncopyable {
72    DI_MATRIX *phmatrix;
73    char      *full_name;
74
75public:
76    DI_ENTRY(GBDATA *gbd, DI_MATRIX *phmatri);
77    DI_ENTRY(char *namei, DI_MATRIX *phmatri);
78    ~DI_ENTRY();
79
80    AP_sequence *sequence;
81
82    // @@@ remove the 2 ptrs below. just use 'sequence' above (that's what inheritance was made for)
83    AP_sequence_parsimony      *sequence_parsimony; // if exist ok
84    AP_sequence_simple_protein *sequence_protein;
85
86    char *name;
87    int   group_nr;                                 // species belongs to group number xxxx
88};
89
90enum DI_SAVE_TYPE {
91    DI_SAVE_PHYLIP_COMP,
92    DI_SAVE_READABLE,
93    DI_SAVE_TABBED
94};
95
96enum LoadWhat { DI_LOAD_ALL, DI_LOAD_MARKED, DI_LOAD_LIST };
97
98class MatrixOrder : virtual Noncopyable {
99    GB_HASH *name2pos; // key = species name, value = order in sort_tree [1..n]
100                       // if no sort tree was specified, name2pos is NULL
101    int      leafs;    // number of leafs
102
103    bool tree_contains_dups; // unused (if true, matrix sorting works partly wrong)
104
105    void insert_in_hash(GBT_TREE *tree) {
106        if (tree->is_leaf) {
107            arb_assert(tree->name);
108            if (GBS_write_hash(name2pos, tree->name, ++leafs) != 0) {
109                tree_contains_dups = true;
110            }
111        }
112        else {
113            insert_in_hash(tree->rightson);
114            insert_in_hash(tree->leftson);
115        }
116    }
117
118public:
119    MatrixOrder(GBDATA *gb_main, GB_CSTR sort_tree_name);
120    ~MatrixOrder() { if (name2pos) GBS_free_hash(name2pos); }
121
122    bool defined() const { return leafs; }
123    int get_index(const char *name) const {
124        // return 1 for lowest and 'leafs' for highest species in sort-tee
125        // return 0 for all species missing in sort-tree
126        return defined() ? GBS_read_hash(name2pos, name) : -1;
127    }
128    void applyTo(struct TreeOrderedSpecies **gb_species_array, size_t array_size) const;
129};
130
131typedef void (*DI_MATRIX_CB)();
132
133class DI_MATRIX : virtual Noncopyable {
134    GBDATA  *gb_species_data;
135    long     seq_len;
136    char     cancel_columns[256];
137    size_t   entries_mem_size;
138    AliView *aliview;
139
140    GBDATA *get_gb_main() const { return aliview->get_gb_main(); }
141    double  corr(double dist, double b, double & sigma);
142    char   *calculate_overall_freqs(double rel_frequencies[AP_MAX], char *cancel_columns);
143    int     search_group(GBT_TREE *node, GB_HASH *hash, size_t& groupcnt, char *groupname, DI_ENTRY **groups);
144
145public:
146    // @@@ make members private:
147    bool             is_AA;
148    DI_ENTRY       **entries;
149    size_t           nentries;
150    AP_smatrix      *matrix;
151    DI_MATRIX_TYPE   matrix_type;
152
153    explicit DI_MATRIX(const AliView& aliview);
154    ~DI_MATRIX();
155
156    const char *get_aliname() const { return aliview->get_aliname(); }
157    const AliView *get_aliview() const { return aliview; }
158
159    GB_ERROR load(LoadWhat what, const MatrixOrder& order, bool show_warnings, GBDATA **species_list) __ATTR__USERESULT;
160    char *unload();
161    const char *save(const char *filename, enum DI_SAVE_TYPE type);
162
163    GB_ERROR  calculate(const char *cancel, DI_TRANSFORMATION transformation, bool *aborted_flag, AP_matrix *userdef_matrix);
164    GB_ERROR  calculate_pro(DI_TRANSFORMATION transformation, bool *aborted_flag);
165    GB_ERROR  extract_from_tree(const char *treename, bool *aborted_flag);
166
167    DI_TRANSFORMATION detect_transformation(std::string& msg);
168
169    char *compress(GBT_TREE *tree);
170};
171
172class DI_GLOBAL_MATRIX : virtual Noncopyable {
173    DI_MATRIX    *matrix;
174    DI_MATRIX_CB  changed_cb;
175
176    void announce_change() { if (changed_cb) changed_cb(); }
177
178    void forget_no_announce() {
179        delete matrix;
180        matrix = NULL;
181    }
182
183    void set(DI_MATRIX *new_global) { di_assert(!matrix); matrix = new_global; announce_change(); }
184
185public:
186    DI_GLOBAL_MATRIX() : matrix(NULL), changed_cb(NULL) {}
187    ~DI_GLOBAL_MATRIX() { forget(); }
188
189    DI_MATRIX *get() { return matrix; }
190    void forget() {
191        if (matrix) {
192            forget_no_announce();
193            announce_change();
194        }
195    }
196    void replaceBy(DI_MATRIX *new_global) { forget_no_announce(); set(new_global); }
197
198    bool exists() const { return matrix != NULL; }
199
200    void set_changed_cb(DI_MATRIX_CB cb) {
201        // announce_change(); // do by caller if really needed
202        changed_cb = cb;
203    }
204
205    DI_MATRIX *swap(DI_MATRIX *other) {
206        DI_MATRIX *prev = matrix;
207        matrix          = other;
208        announce_change();
209        return prev;
210    }
211
212    bool has_type(DI_MATRIX_TYPE type) const {
213        return matrix && matrix->matrix_type == type;
214    }
215    void forget_if_not_has_type(DI_MATRIX_TYPE wanted_type) {
216        if (matrix && matrix->matrix_type != wanted_type) {
217            forget();
218        }
219    }
220};
221
222extern DI_GLOBAL_MATRIX GLOBAL_MATRIX;
223
224class WeightedFilter;
225struct save_matrix_params {
226    const char           *awar_base;
227    const WeightedFilter *weighted_filter;
228};
229
230AW_window *DI_create_save_matrix_window(AW_root *aw_root, save_matrix_params *save_params);
231
232#else
233#error di_matr.hxx included twice
234#endif // DI_MATR_HXX
Note: See TracBrowser for help on using the repository browser.