HomoloGene - HomoloGene

HomoloGene , narzędzie Narodowego Centrum Informacji Biotechnologicznej Stanów Zjednoczonych (NCBI), to system automatycznego wykrywania homologów (podobieństwa przypisywanego pochodzeniu od wspólnego przodka) wśród opatrzonych adnotacjami genów kilku całkowicie zsekwencjonowanych genomów eukariotycznych.

Przetwarzanie HomoloGene obejmuje analizę białek organizmów wejściowych. Sekwencje są porównywane za pomocą blastp, a następnie dopasowywane i umieszczane w grupach, przy użyciu drzewa taksonomicznego zbudowanego na podstawie podobieństwa sekwencji, w którym najpierw dopasowywane są bliżej spokrewnione organizmy, a następnie kolejne organizmy są dodawane do drzewa. Dopasowania białek są mapowane z powrotem do odpowiadających im sekwencji DNA, a następnie można obliczyć metryki odległości jako odległości molekularne Jukes i Cantor (1969) , stosunek Ka / Ks .

Sekwencje są dopasowywane przy użyciu algorytmu heurystycznego maksymalizującego wynik globalnie, a nie lokalnie, w dopasowaniu dwustronnym (patrz pełny wykres dwudzielny ). Następnie oblicza znaczenie statystyczne każdego dopasowania. Odcięcia są tworzone dla pozycji, a wartości Ks są ustawiane, aby zapobiec grupowaniu fałszywych „ortologów” . „Paralogi” identyfikuje się, znajdując sekwencje, które są bliżej gatunku niż inne gatunki.

Organizmy wejściowe

Metazoa

Kręgowce

Homo sapiens , Pan troglodytes , Mus musculus , Rattus norvegicus , Canis lupus familiaris , Bos taurus , Gallus gallus , Xenopus tropicalis , Danio rerio "

Bezkręgowce

" Drosophila melanogaster , Anopheles gambiae , Caenorhabditis elegans "

Grzyby

" Saccharomyces cerevisiae , Schizosaccharomyces pombe , Kluyveromyces lactis , Eremothecium gossypii , Magnaporthe grisea , Neurospora crassa "

Rośliny

Dicots

Arabidopsis thaliana

Jednoliścienne

Oryza sativa

Protista

Plasmodium falciparum .

Berło

HomoloGene jest powiązany ze wszystkimi bazami danych Entrez i opiera się na informacji o homologii i fenotypie tych linków:

W rezultacie HomoloGene wyświetla informacje o genach, białkach, fenotypach i konserwowanych domenach.

Bibliografia

Linki zewnętrzne