FAM214A - FAM214A

FAM214A
Lokalizacja genu FAM214A na Chromosomie 15.png
Identyfikatory
Skróty FAM214A , KIAA1370, rodzina o podobieństwie sekwencji 214 członek A
Identyfikatory zewnętrzne MGI: 2387648 HomoloGene: 35065 GeneCards: FAM214A
Lokalizacja genu (człowiek)
Chromosom 15 (ludzki)
Chr. Chromosom 15 (ludzki)
Chromosom 15 (ludzki)
Lokalizacja genomowa FAM214A
Lokalizacja genomowa FAM214A
Zespół muzyczny 15q21.2-q21,3 Początek 52 581 317 pz
Koniec 52 709 817 pz
Ortologi
Gatunki Człowiek Mysz
Entrez
Ensembl
UniProt
RefSeq (mRNA)

NM_001286495
NM_019600

NM_001113283
NM_153584
NM_001359816

RefSeq (białko)

NP_001273424
NP_062546

NP_001106754
NP_705812
NP_001346745

Lokalizacja (UCSC) Chr 15: 52,58 - 52,71 Mb Chr 9: 74,95 - 75,03 Mb
Wyszukiwanie PubMed
Wikidata
Wyświetl / edytuj człowieka Wyświetl / edytuj mysz

Białko FAM214A , znane również jako rodzina białek o podobieństwie sekwencji 214, A (FAM214A) jest białkiem, które u ludzi jest kodowane przez gen FAM214A . FAM214A to gen o nieznanej funkcji znaleziony w locus q21.2-q21.3 na chromosomie 15 (ludzki) . Białko produkt tego genu dwie konserwowane domeny, jeden o nieznanej funkcji (DUF4210) i drugi o nazwie Chromosome_Seg. Chociaż funkcja białka FAM214A nie została scharakteryzowana, przewiduje się, że zarówno DUF4210, jak i Chromosome_Seg odgrywają rolę w segregacji chromosomów podczas mejozy.

Gen

Przegląd

FAM214A gen znajduje się na nici DNA ujemne (patrz sensowny (Molecular Biology) ) chromosomu 15 między pozycją 52,873,514 i 53,002,014; w ten sposób tworząc gen o długości 97,303 par zasad (pz). FAM214A był wcześniej oznaczony dwoma innymi aliasami, znanymi jako KIAA1370 i FLJ10980. Przewiduje się, że gen FAM214A zawiera 12 eksonów, które obejmują końcowy transkrypt mRNA o wielkości 4231 pz po wystąpieniu transkrypcji . To właśnie ten produkt mRNA ulega następnie translacji do końcowego białka FAM214A przy pomocy sekwencji promotora i czynników transkrypcyjnych . Promotor sekwencji mRNA FAM214A przewidziano i przeanalizowano za pomocą programu El Dorado na Genomatix. Ten promotor ma długość 601 par zasad i obejmuje część 5 'UTR.

Lokalizacja FAM214A na chromosomie 15
Schemat genu FAM214A zawierającego introny i egzony na chromosomie 15

Ekspresja genu

Dane ekspresji dla FAM214A uzyskane z kart genowych

Według wielu źródeł, takich jak BioGPS i Atlas Ekspresji, FAM214A jest powszechnie (lub prawie tak blisko) wyrażany na niskich poziomach. Jak widać na poniższym obrazku BioGPS, istnieje znacznie wyższy poziom ekspresji w komórkach i tkankach związanych z odpornością, co sugeruje rolę immunologiczną; jednakże nie ma konkretnych dowodów in situ na poparcie tego twierdzenia. Dane dotyczące ekspresji zostały zebrane z szeregu badań przeprowadzonych na szerokim zakresie genów, dlatego niektóre dane są z natury sprzeczne.

Dane ekspresji dla FAM214A uzyskane z BioGPS

Białko

Przegląd

Funkcja białka FAM214A u ludzi jest nadal nieznana; jednak istnieją trzy funkcjonalne powiązania terminów, w tym „proces biologiczny”, „składnik komórkowy” i funkcja molekularna ”, które opisują funkcję tego białka w Ontologii Genu, która przewiduje implikacje jego podstawowej funkcji in vivo . Produkt białkowy FAM214A składa się z 1076 aminokwasów (aa), przewiduje się, że ma masę cząsteczkową 121,700 daltonów i ma punkt izoelektryczny około pH 7,7. Przewiduje się, że białko to pozostanie w jądrze po transkrypcji na podstawie braku sekwencji peptydu sygnałowego i prognozy programu PSORTII. Ze względu na alternatywny splicing zaobserwowano dwie inne izoformy (Q32MH5-2 i Q32MH5-3). Różnią się one nieznacznie od produktu pierwotnego. Izoforma 2 ma cztery różne aminokwasy z zasad 960-960 i jest brakuje końca sekwencji z zasad 964-1076. Izoforma 3 ma siedem dodatkowych aminokwasów dodanych na początku sekwencji po metioninie.

Przewiduje się, że po translacji białko FAM214A pozostanie w jądrze przez więcej niż jeden typ podprogramu PSORT II. To białko ma sygnał pat4, jeden z dwóch „klasycznych” sygnałów lokalizacji jądrowej (NLS), zaczynając od reszty 709. Chociaż nie ma drugiego „klasycznego” NLS, pat7, ani „nieklasycznego” dwuczęściowego NLS to nadal przewiduje się, że będzie celem dla jądra na podstawie wyniku NCNN. Ten wynik przewiduje, na podstawie sekwencji aminokwasów, czy białko jest kierowane do jądra, czy do cytoplazmy. Dla białka FAM214A wynik NCNN przewidywał lokalizację jądra z 94,1% pewnością. W oparciu o te informacje PSORT generuje ogólne przewidywanie lokalizacji subkomórkowej białka. W przypadku FAM214A przewidywane wartości wynosiły 69,6% dla jądra w porównaniu z 13,0% dla mitochondriów, 8,7% dla cytoplazmy i 4,3% dla pęcherzyków wydzielniczych i retikulum endoplazmatycznego.

Modyfikacje potranslacyjne

Przewidywane miejsca fosforylacji znalezione w białku FAM214A

Białko to najprawdopodobniej nie podlega znacznej liczbie modyfikacji potranslacyjnych z powodu braku sekwencji peptydu sygnałowego przewidzianej przez NetNGlyc i NetOGlyc na serwerze sieciowym ExPASy. Dzieje się tak, ponieważ wiele mechanizmów wewnątrzkomórkowych wykonujących modyfikacje potranslacyjne wymaga, aby białko przemieszczało się przez organelle, takie jak retikulum endoplazmatyczne i aparat Golgiego . Bez sekwencji peptydu sygnałowego białko na ogół nie opuszcza jądra, co zostało przewidziane przez PSORT II, ​​jak opisano powyżej.

Analizę SAPS tego białka przeprowadzono w bazie danych swp23s.q, która wskazała na obecność nieprawidłowo dużej liczby aminokwasów seryny i nieprawidłowo małej liczby aminokwasów alaninowych w tym białku. Według artykułu przeglądowego Fayarda i wsp., Kinaza zależna od fosfoinozytydu 2 (PDK2) jest kinazą serynowo-treoninową, która jest ważna dla regulacji cyklu komórkowego. Ponieważ białko FAM214A ma większą liczbę grup seryny niż uważa się za normalne, istnieje możliwość, że PDK2 ma istotny wpływ na to białko. W celu ustalenia, czy w rzeczywistości przewidywano, że nadmierna liczba seryn jest fosforylowana, sekwencję białka przepuszczono przez program NetPhos z serwera internetowego ExPASy. Program ten przewidział fosforylację 69 seryn, 14 treonin i 9 tyrozyn. Zgodnie z powyższą analizą SAPS istnieje łącznie 134 seryny, co wskazuje, że przewiduje się, że około połowa jest fosforylowana in vivo . Schemat przewidywań fosforylacji pokazano po prawej stronie.

Inny rodzaj modyfikacji potranslacyjnych został przewidziany dla białka FAM214A w programie NetCorona na ExPASy. Program przewidział pojedyncze miejsce cięcia między pozycjami 214 i 215 w sekwencji białka FAM214A po translacji.

Interakcje białek

Istnieje wiele miejsc wiązania czynników transkrypcyjnych przewidzianych dla sekwencji promotora FAM214A. Kilka z nich o najwyższej przewidywanej ufności przedstawiono w poniższej tabeli.

Możliwe czynniki transkrypcji, które będą wiązać się z sekwencją promotora FAM214A

Przewidywany współczynnik transkrypcji Początek Koniec Pasmo Pewność siebie
Element rozpoznający czynnik transkrypcyjny II B (TFIIB) 97 103 Negatywny 1.0
Białko szpikowego palca cynkowego MZF1 151 161 Negatywny 1.0
Mielinowy czynnik transkrypcji 1, neuronalny czynnik C2HC z palcem cynkowym 1 388 400 Negatywny 0.945
Miejsce wiązania receptora androgenu, miejsca IR3 495 513 Negatywny 0.923
Wilms Tumor Suppressor 1 17 Pozytywny 0.968
Niepalindromiczne miejsca wiązania czynnika jądrowego I. 27 47 Pozytywny 0.988
Alternatywny wariant splicingu FOXP1, aktywowany w ESC 383 383 Pozytywny 1.0
Gen gruczolaka pleomorficznego 1 488 510 Pozytywny 1.0
Gen 1 podobny do ETS (ELK-1) 569 589 Pozytywny 0.961
FAM214A czynnik nietranskrypcyjny przewidywał interakcje białek

Jedyne białko, co do którego przewiduje się, że według STRING będzie oddziaływać z białkiem FAM214A, nazywa się MFSD6L . Przewiduje się, że to białko należy do głównej nadrodziny pośredniczącej jako białko transbłonowe. Podobnie jak FAM214A, funkcja tego białka nie została jeszcze scharakteryzowana w drodze eksperymentów ani badań. Ponieważ to białko MFSD6L jest jedyną przewidzianą z jakąkolwiek pewnością interakcją białkową FAM214A, jego sekwencję przeprowadzono w programie PSORT II. Dane z podprogramu NLS przewidywały obecność jednej sekwencji pat4 i dwóch sekwencji NLS pat7, wskazując w ten sposób możliwą lokalizację jądrową. Z drugiej strony wynik NCNN przewidywał lokalizację cytoplazmatyczną z pewnością 94,1%, pozostawiając ogólny wynik PSORT II na poziomie 39,1% błony plazmatycznej, 39,1% retikulum endoplazmatycznego, 4,3% wakuolowej, 4,3% pęcherzyków układu wydzielniczego, 4,3% Golgiego, 4,3% mitochondrialne i 4,3% jądrowe. Jest to sprzeczne, ponieważ istnieją trzy całkowite sygnały lokalizacji jądrowej, ale może to wynikać z faktu, że znacząca transbłonowa natura białka MFSD6L może powodować problemy z tymi przewidywaniami.

Niewielki procent trzeciorzędowej struktury FAM214A

Struktura drugorzędna i trzeciorzędowa

Struktura drugorzędowa białka FAM214A składa się z pewnej liczby alfa-helisy i beta arkuszy zgodnie z przewidywaniami i Biology Workbenchem P rotein H omology analogowo / Y R ecognition e ngine (PHYRE). Program PHYRE przewiduje, że 66 procent struktury drugorzędowej FAM214A jest nieuporządkowanych, a zatem nie można ich przeanalizować i przekształcić w przewidywaną strukturę trzeciorzędową. To było; jednak jest w stanie przewidzieć około 10 procent struktury białka z 95-procentowym znaczeniem. Schemat pokazany jest po lewej stronie.

Ochrona

Paralog

Pojedynczy gen paralogiczny został znaleziony na chromosomie 9 u Homo sapiens i został nazwany FAM214B (rodzina o podobieństwie sekwencji, B). FAM214B, chociaż uważany za paralog , ma znacząco inną sekwencję białka niż FAM214A. Kiedy te dwa zostały porównane ze sobą w BLAST NCBI, jedyne zaobserwowane znaczące podobieństwo dotyczyło ostatnich 200 aminokwasów (gdzie zlokalizowane są domeny DUF4210 i Chromosome_Seg). Chociaż podobieństwo między FAM214A i B jest niskie, te dwa białka należą do tej samej rodziny białek i zawierają te same dwie konserwowane domeny .

Ortologi

Białko FAM214A ma znaczną liczbę ortologów w dużej liczbie grup taksonomicznych, w tym ssaków , ptaków , reptilii , płazów , Actinopterygii , Echinoidea , Insecta , Trematoda , Crustacea , Tricoplacia, Anthozoa i Eurotiomycetes . Wskazuje to, że białko FAM214A jest dobrze konserwowane u eukariontów, ale nie wydaje się być konserwowane w bakteriach lub archeonach . We wszystkich ortologach najbardziej konserwowany region znajdował się blisko końca białka, w którym znajdują się konserwowane domeny (patrz poniżej). Ortologi dla ludzkiego białka FAM214A stwierdzono już w trufla czarnozarodnikowa , Talaromyces stipitatus i Aspergillus nidulans , które rozeszły około 1215000000 lat temu.

Ortologi dla białka FAM214A

Rodzaj Gatunki Nazwa zwyczajowa Rozbieżność z ludzką linią (MYA) Numer dostępu białka NCBI Długość sekwencji Procent identyczności z sekwencją ludzką Wspólna nazwa genu
Homo sapiens Człowiek - NP_062546.2 1076 100 FAM214A
Pan troglodytes Szympans zwyczajny 6.3 XP_003314724 1083 99 FAM214A
Pan paniscus Bonobo 6.3 XP_003827895.1 1076 100 FAM214A
Rattus norvegicus Szczur 92.3 NP_001100308 1074 100 LOC300836
Bos taurus Krowa 94.2 XP_601152 1087 100 KIAA1370
Canus lupus familiaris Pies 94.2 XP_544682 1081 100 KIAA1370
Ornithorhynchus anatinus Dziobak 167,4 XP_001515207 1169 95 KIAA1370
Gallus gallus kurczak 296,0 NP_001005811 1093 99 FAM214A
Taeniopygia guttata Zebra Finch 296,0 XP_002196177 1112 99 FAM214A
Anolis carolinensis Carolina Anole 296,0 XP_003227400 1086 99 KIAA1370
Xenopus tropicalis Tropikalna żaba szponiasta 371,2 NP_001015702 946 98 FAM214A
Danio rerio Danio pręgowany 400.1 NP_001189349 1021 75 FAM214A
Apis mellifera Pszczoła miodna 782,7 XP_393903 1339 45 LOC410423
Strongylocentrotus purpuratus Sea Urchin 742,9 XP_799179 297 27 Podobne do FAM214A
muszka owocowa Muszka owocowa 782,7 NP_610688 1297 27 CG9005
Schistosoma mansoni Pasożyt Schistosome 792,4 XP_002579285 766 26 Hipotetyczne białko
Daphnia pulex Pchła wodna zwyczajna 782,7 EFX87516 200 18 Hipotetyczne białko DAPPUDRAFT_207300
Nematostella vectensis Morski Anemon 855,3 milionów lat temu XP_001633540 191 18 Hipotetyczne białko
Tuber melanosporum Trufla 1215,8 XP_002841833 622 15 Hipotetyczne białko
Talaromyces stipitatus - 1215,8 XP_002478567 797 25 Konserwatywne białko hipotetyczne
Aspergillus nidulans Grzyb nitkowaty 1215,8 XP_658605 728 15 hipotetyczne białko AN100 1.2

Filogeneza

Ewolucyjny związek między FAM214A a jego ortologicznymi białkami

Nieukorzenione drzewo filogenetyczne składające się z 20 ortologów zostało wygenerowane przez program CLUSTALW w Biology Workbench, aby zademonstrować ewolucyjny związek między FAM214A a jego ortologami.

Domeny chronione

W obrębie białka FAM214A znajdują się trzy dobrze konserwowane regiony. Obejmują one dobrze konserwowany region w pobliżu n-końca białka i dwie konserwowane domeny, w tym domenę o nieznanej funkcji 4210 (DUF4210) i domenę Chromosome_Seg w pobliżu c-końca . Schematyczny diagram tych trzech regionów przedstawiono poniżej. Nie przewiduje się, aby dobrze konserwowany region w pobliżu n-końca białka zawierał jakiekolwiek znane domeny lub motywy; jednakże miejsce rozszczepienia przewidziane przez NetCorona powyżej znajduje się w tym regionie i jest dobrze konserwowane w większości białek ortologicznych względem FAM214A. Dwie konserwatywne domeny znajdujące się na końcu tego białka są najważniejszą częścią peptydu opartą na historii ewolucji. Wszystkie organizmy w powyższej tabeli Ortholog z wyjątkiem dziobaka (któremu brakuje domeny Chromosome_Seg) zawierają obie te konserwatywne domeny w swojej sekwencji białkowej.

Schemat białka Homo sapiens FAM214A przedstawiający dobrze konserwowane regiony i ich lokalizacje

Bibliografia