Projekt genomu człowieka - Human Genome Project

Logo Projektu Ludzkiego Genomu

Human Genome Project ( HGP ), to międzynarodowe badania naukowe projekt z celu określenia par zasad , które tworzą ludzkiego DNA oraz identyfikacji i odwzorowywanie wszystkich genów w ludzkim genomie , zarówno z fizycznego i funkcjonalnego punktu widzenia. Pozostaje największym na świecie wspólnym projektem biologicznym. Planowanie rozpoczęło się po tym, jak pomysł został podjęty w 1984 przez rząd Stanów Zjednoczonych , projekt formalnie rozpoczął się w 1990 roku i został uznany za ukończony 14 kwietnia 2003 roku. Poziom „pełnego genomu” został osiągnięty w maju 2021 roku.

Fundusze pochodziły od rządu amerykańskiego za pośrednictwem National Institutes of Health (NIH), a także wielu innych grup z całego świata. Równoległy projekt został przeprowadzony poza rządem przez Celera Corporation , czyli Celera Genomics, który został formalnie uruchomiony w 1998 roku. Większość sponsorowanych przez rząd sekwencjonowania przeprowadzono w dwudziestu uniwersytetach i ośrodkach badawczych w Stanach Zjednoczonych , Wielkiej Brytanii , Japonii , Francja , Niemcy , Indie i Chiny .

Human Genome Project pierwotnie miał na celu zmapowanie nukleotydów zawartych w ludzkim haploidalnym genomie referencyjnym (ponad trzy miliardy). „Genom” każdej danej osoby jest unikalny; mapowanie „ludzkiego genomu” obejmowało sekwencjonowanie niewielkiej liczby osobników, a następnie składanie w celu uzyskania pełnej sekwencji dla każdego chromosomu. Dlatego gotowy ludzki genom jest mozaiką, nie reprezentującą żadnego pojedynczego osobnika. Użyteczność projektu wynika z faktu, że zdecydowana większość ludzkiego genomu jest taka sama u wszystkich ludzi.

Projekt genomu człowieka

Historia

Podział DNA.png

Human Genome Project był 13-letnim projektem finansowanym ze środków publicznych, zainicjowanym w 1990 roku, którego celem było określenie sekwencji DNA całego euchromatycznego genomu ludzkiego w ciągu 15 lat.

W maju 1985 r. Robert Sinsheimer zorganizował warsztaty na Uniwersytecie Kalifornijskim w Santa Cruz , aby omówić sekwencjonowanie ludzkiego genomu, ale z wielu powodów NIH nie był zainteresowany realizacją tej propozycji. W marcu następnego roku warsztaty w Santa Fe zorganizowali Charles DeLisi i David Smith z Biura ds. Zdrowia i Badań Środowiskowych Departamentu Energii (OHER). W tym samym czasie Renato Dulbecco zaproponował sekwencjonowanie całego genomu w eseju w Science. Dwa miesiące później James Watson odbył warsztaty w Cold Spring Harbor Laboratory. Tak więc pomysł na uzyskanie sekwencji referencyjnej miał trzy niezależne źródła: Sinsheimer, Dulbecco i DeLisi. Ostatecznie to działania firmy DeLisi zapoczątkowały projekt.

Fakt, że warsztaty w Santa Fe były motywowane i wspierane przez Agencję Federalną, otworzył drogę, choć trudną i krętą, do przekucia pomysłu na politykę publiczną w Stanach Zjednoczonych . W notatce do asystenta sekretarza ds. badań energetycznych (Alvin Trivelpiece), Charles DeLisi, który był wówczas dyrektorem OHER, przedstawił szeroki plan projektu. Rozpoczęło to długi i złożony łańcuch wydarzeń, które doprowadziły do ​​zatwierdzonego przeprogramowania funduszy, które umożliwiło OHER uruchomienie Projektu w 1986 r. i zarekomendowanie pierwszej pozycji dla HGP, która była w przedłożeniu budżetu prezydenta Reagana na 1988 r. i ostatecznie zatwierdziła. przez Kongres. Szczególne znaczenie dla aprobaty Kongresu miało poparcie senatora Nowego Meksyku Pete Domeniciego , z którym zaprzyjaźnił się DeLisi. Domenici przewodniczył Senackiej Komisji Energii i Zasobów Naturalnych, a także Komisji Budżetowej, które miały kluczowe znaczenie w procesie budżetowym Departamentu Energii. Kongres dodał porównywalną kwotę do budżetu NIH, tym samym rozpoczynając oficjalne finansowanie przez obie agencje.

Alvin Trivelpiece zwrócił się do zastępcy sekretarza Williama Flynna Martina i uzyskał aprobatę dla propozycji DeLisi . Ten wykres został wykorzystany wiosną 1986 roku przez Trivelpiece, ówczesnego dyrektora Biura Badań Energetycznych w Departamencie Energii, aby poinformować Martina i podsekretarza Josepha Salgado o zamiarze przeprogramowania 4 milionów dolarów na rozpoczęcie projektu za zgodą sekretarza. Herringtona . Po tym przeprogramowaniu nastąpił budżet linii budżetowej w wysokości 16 milionów dolarów w przedłożonym Kongresowi przez Administrację Reagana budżetem z 1987 roku. Następnie przeszedł przez obie izby. Projekt zaplanowano na 15 lat.

Technologie kandydujące były już rozważane w proponowanym przedsięwzięciu, co najmniej już w 1979 r.; Ronald W. Davis i koledzy z Uniwersytetu Stanforda złożyli w tym roku propozycję do NIH, która została odrzucona jako zbyt ambitna.

W 1990 r. dwie główne agencje finansujące, DOE i NIH , opracowały protokół ustaleń w celu skoordynowania planów i ustalenia czasu rozpoczęcia Projektu do 1990 r. W tym czasie David Galas był dyrektorem przemianowanego na Badania biologiczne i środowiskowe” w Biurze Naukowym Departamentu Energii USA, a James Watson kierował Programem Genomu NIH. W 1993 r. Aristides Patrinos zastąpił Galasa, a Francis Collins zastąpił Jamesa Watsona , obejmując rolę ogólnego szefa projektu jako dyrektora Narodowego Centrum Badań nad Genomem Człowieka (NIH) w USA (które później przekształciło się w Narodowy Instytut Badań nad Genomem Człowieka). ). Roboczy projekt genomu ogłoszono w 2000 r., a opisujące go artykuły opublikowano w lutym 2001 r. Pełniejszy projekt opublikowano w 2003 r., a prace nad „wykańczaniem” genomu trwały ponad dekadę.

Projekt o wartości 3 miliardów dolarów został formalnie założony w 1990 roku przez Departament Energii Stanów Zjednoczonych i Narodowy Instytut Zdrowia i miał potrwać 15 lat. Oprócz Stanów Zjednoczonych, międzynarodowych konsorcjów składających genetyków w Wielkiej Brytanii, Francji, Australii, Chinach i niezliczonych innych spontanicznych relacji. Projekt kosztował mniej niż oczekiwano około 2,7 miliarda dolarów (rok finansowy 1991). Po skorygowaniu o inflację kosztuje to około 5 miliardów dolarów (rok finansowy 2018).

Ze względu na szeroko zakrojoną współpracę międzynarodową i postępy w dziedzinie genomiki (zwłaszcza w analizie sekwencji ), a także znaczne postępy w technologii komputerowej, w 2000 r. ukończono „wstępny projekt” genomu (ogłoszony wspólnie przez prezydenta USA Billa Clintona i Brytyjczyków). Premier Tony Blair 26 czerwca 2000 r.). Ten pierwszy dostępny wstępny montaż genomu został ukończony przez Genome Bioinformatics Group na Uniwersytecie Kalifornijskim w Santa Cruz , kierowany głównie przez ówczesnego doktoranta Jima Kenta . Trwające sekwencjonowanie doprowadziło do ogłoszenia zasadniczo kompletnego genomu 14 kwietnia 2003 r., dwa lata wcześniej niż planowano. W maju 2006 roku, kolejny kamień milowy został przekazany na drodze do realizacji projektu, gdy sekwencja ostatniego chromosomu został opublikowany w Nature .

Instytucje, firmy i laboratoria w Programie Genomu Ludzkiego są wymienione poniżej, zgodnie z NIH :

Nie. Naród Nazwa Przynależność
1 Stany Zjednoczone The Whitehead Institute/MIT Center for Genome Research Instytut Technologii w Massachusetts
2 Zjednoczone Królestwo Wellcome Trust Sanger Institute Witaj zaufanie
3 Stany Zjednoczone Centrum sekwencjonowania genomu Washington University School of Medicine Uniwersytet Waszyngtoński w St. Louis
4 Stany Zjednoczone Stany Zjednoczone DOE Joint Genome Institute Departament Energii Stanów Zjednoczonych
5 Stany Zjednoczone Centrum Sekwencjonowania Genomu Ludzkiego Baylor College of Medicine Baylor College of Medicine
6 Japonia Centrum Nauk Genomowych RIKEN Riken
7 Francja Genoskop i CNRS UMR-8030 Francuska Komisja ds. Energii Alternatywnych i Energii Atomowej
8 Stany Zjednoczone Centrum sekwencjonowania GTC Genome Therapeutics Corporation , której dział sekwencjonowania zostaje przejęty przez ABI
9 Niemcy Zakład Analizy Genomu Fritz Lipmann Institute , zmieniono nazwę z Instytutu Biotechnologii Molekularnej
10 Chiny Pekiński Instytut Genomiki / Centrum Genomu Człowieka Chińska Akademia Nauk
11 Stany Zjednoczone Wielomegabazowe centrum sekwencjonowania Instytut Biologii Systemów
12 Stany Zjednoczone Centrum Technologii Genomu w Stanford Uniwersytet Stanford
13 Stany Zjednoczone Centrum Genomu Ludzkiego Stanforda i Wydział Genetyki Szkoła Medyczna Uniwersytetu Stanforda
14 Stany Zjednoczone Centrum genomu Uniwersytetu Waszyngtońskiego uniwersytet Waszyngtoński
15 Japonia Zakład Biologii Molekularnej Szkoła Medyczna Uniwersytetu Keio
16 Stany Zjednoczone University of Texas Southwestern Medical Center w Dallas Uniwersytet Teksasu
17 Stany Zjednoczone Zaawansowane Centrum Technologii Genomu Uniwersytetu Oklahomy Wydział Chemii i Biochemii Uniwersytetu Oklahoma
18 Niemcy Instytut Genetyki Molekularnej im. Maxa Plancka Towarzystwo Maxa Plancka
19 Stany Zjednoczone Centrum genomu Lity Annenberg Hazen Laboratorium Cold Spring Harbor
20 Niemcy GBF/Niemieckie Centrum Badawcze Biotechnologii Reorganizacja i zmiana nazwy na Helmholtz Center for Infection Research

Dodatkowo, począwszy od 2000 roku i trwającej przez trzy lata w Rosji , Rosyjska Fundacja Badań Podstawowych (RFFI) ( ros . Российский фонд фундаментальных исследований (РФФИ) ) przyznała grant w wysokości około 500 tysięcy rubli na sfinansowanie mapowania genomu Rosjan : Wołogdy-Vyatka ( rosyjski : Вологда-Вятка ) Ilmen-Belozersk ( rosyjski : Ильмень-Белозерск ) i Valdai ( rosyjski : Валдай )) przez Laboratorium populacji ludzkiej Genetyki Genetics Medical Center w Rosyjskiej Akademii Nauk Medycznych ( ros : лаборатории популяционной генетики человека Медико-генетического центра Российской академина медицинс ). Chociaż czołowym rosyjskim genetykiem w 2004 roku jest Sergei Inge-Vechtomov ( ros . Сергей Инге-Вечтомов ), badaniami kierowała doktor nauk biologicznych Elena Balanovskaya ( ros . Елена Балановская ) w Laboratorium Genetyki Ludzkości w Moskwie . Od 2004 roku Evgeny Ginter jest opiekunem naukowym Centrum Genetyki Medycznej w Moskwie.

Stan ukończenia

Projekt nie był w stanie zsekwencjonować całego DNA znajdującego się w ludzkich komórkach . Zsekwencjonował tylko euchromatyczne regiony genomu, które stanowią 92,1% genomu ludzkiego. Pozostałe regiony, zwane heterochromatycznymi , znajdują się w centromerach i telomerach i nie zostały zsekwencjonowane w ramach projektu.

Human Genome Project (HGP) został uznany za zakończony w kwietniu 2003 roku. Wstępny wstępny szkic ludzkiego genomu był dostępny w czerwcu 2000 roku, a do lutego 2001 roku robocza wersja robocza została ukończona i opublikowana, po czym nastąpiło ostateczne zmapowanie ludzkiego genomu na 14 kwietnia 2003 r. Chociaż doniesiono, że obejmuje to 99% euchromatycznego ludzkiego genomu z 99,99% dokładnością, główna ocena jakości sekwencji ludzkiego genomu została opublikowana 27 maja 2004 r., wskazując, że ponad 92% próbkowania przekroczyło 99,99% dokładności, co mieściło się w zamierzonym celu.

W marcu 2009 r. Genome Reference Consortium (GRC) opublikowało dokładniejszą wersję ludzkiego genomu, ale nadal pozostawiło to ponad 300 luk, podczas gdy 160 takich luk pozostało w 2015 roku.

Chociaż w maju 2020 r. GRC zgłosiło 79 „nierozwiązanych” luk, stanowiących aż 5% ludzkiego genomu, miesiące później zastosowanie nowych technik sekwencjonowania dalekiego zasięgu i homozygotycznej linii komórkowej, w której obie kopie każdego chromosomu są identyczny doprowadziła do pierwszego telomerów-to-telomeru, prawdziwie pełnej sekwencji chromosomu ludzkiego, chromosomie X .

W 2021 roku ogłoszono, że konsorcjum Telomere-to-Telomere (T2T) wypełniło wszystkie luki. W ten sposób powstał kompletny ludzki genom prawie bez luk, ale nadal miał pięć luk w rybosomalnym DNA. W maju tych ostatnich pięć luk rDNA zostało znalezionych i opublikowanych jako wersja 1.1. Ta sekwencja nie zawiera chromosomu Y, który powoduje, że zarodek staje się męskim, ponieważ obecny był tylko zduplikowany męski plemnik z chromosomem X. Około 0,3% tej sekwencji okazało się trudne do sprawdzenia pod kątem jakości, a zatem zawiera błędy, które są naprawiane.

Wnioski i proponowane korzyści

Sekwencjonowanie ludzkiego genomu przynosi korzyści w wielu dziedzinach, od medycyny molekularnej po ewolucję człowieka . Human Genome Project, poprzez sekwencjonowanie DNA, może pomóc nam zrozumieć choroby, w tym: genotypowanie określonych wirusów w celu ukierunkowania odpowiedniego leczenia; identyfikacja mutacji związanych z różnymi formami raka ; projektowanie leków i dokładniejsze przewidywanie ich skutków; postęp w kryminalistycznych naukach stosowanych; biopaliwa i inne zastosowania energetyczne; rolnictwo , hodowla zwierząt , bioprzetwarzanie ; ocena ryzyka ; bioarcheologia , antropologia i ewolucja . Inną proponowaną korzyścią jest komercyjny rozwój badań genomicznych związanych z produktami opartymi na DNA, co stanowi wielomiliardowy przemysł.

Sekwencja DNA jest przechowywana w bazach danych dostępnych dla każdego w Internecie . Amerykańskie Narodowe Centrum Informacji Biotechnologicznej (i siostrzane organizacje w Europie i Japonii) przechowuje sekwencję genów w bazie danych znanej jako GenBank wraz z sekwencjami znanych i hipotetycznych genów i białek. Inne organizacje, takie jak UCSC Genome Browser na Uniwersytecie Kalifornijskim, Santa Cruz i Ensembl, prezentują dodatkowe dane i adnotacje oraz potężne narzędzia do ich wizualizacji i wyszukiwania. Opracowano programy komputerowe do analizy danych, ponieważ same dane są trudne do interpretacji bez takich programów. Ogólnie rzecz biorąc, postęp w technologii sekwencjonowania genomu podążał za prawem Moore'a , koncepcją wywodzącą się z informatyki, która mówi, że układy scalone mogą zwiększać złożoność w tempie wykładniczym. Oznacza to, że prędkość, z jaką można zsekwencjonować całe genomy, może wzrosnąć w podobnym tempie, co zaobserwowano podczas opracowywania wyżej wspomnianego Human Genome Project.

Techniki i analizy

Proces identyfikacji granic między genami i innymi cechami w surowej sekwencji DNA nazywa się adnotacją genomu i należy do dziedziny bioinformatyki . Podczas gdy doświadczeni biolodzy tworzą najlepszych adnotatorów, ich praca postępuje powoli, a programy komputerowe są coraz częściej wykorzystywane do spełniania wysokowydajnych wymagań projektów sekwencjonowania genomu. Począwszy od roku 2008, nowa technologia znana jako RNA-nast została wprowadzona, które pozwoliły naukowcom bezpośrednio sekwencji RNA w komórkach. Zastąpiło to poprzednie metody adnotacji, które opierały się na nieodłącznych właściwościach sekwencji DNA, pomiarem bezpośrednim, który był znacznie dokładniejszy. Obecnie adnotacja ludzkiego genomu i innych genomów opiera się głównie na głębokim sekwencjonowaniu transkryptów w każdej ludzkiej tkance przy użyciu sekwencji RNA. Eksperymenty te wykazały, że ponad 90% genów zawiera co najmniej jeden, a zwykle kilka alternatywnych wariantów splicingowych, w których eksony są łączone na różne sposoby, aby wytworzyć 2 lub więcej produktów genów z tego samego locus.

Genom opublikowany przez HGP nie reprezentuje sekwencji genomu każdego osobnika. Jest to połączona mozaika niewielkiej liczby anonimowych dawców pochodzenia afrykańskiego, europejskiego i wschodnioazjatyckiego. Genom HGP jest rusztowaniem dla przyszłych prac nad identyfikacją różnic między jednostkami. Kolejne projekty sekwencjonowały genomy wielu różnych grup etnicznych, choć na dzień dzisiejszy istnieje tylko jeden „genom referencyjny”.

Wyniki

Kluczowe ustalenia projektu (2001) i kompletne (2004) sekwencje genomu obejmują:

  1. U ludzi istnieje około 22 300 genów kodujących białka, taki sam zakres jak u innych ssaków.
  2. Genom ludzki ma znacznie więcej duplikacji segmentowych (prawie identyczne, powtarzające się odcinki DNA) niż wcześniej podejrzewano.
  3. W czasie, gdy opublikowano szkic sekwencji, mniej niż 7% rodzin białek wydawało się być specyficznych dla kręgowców.

Osiągnięcia

Pierwszy wydruk ludzkiego genomu, który zostanie zaprezentowany jako seria książek, wystawiony w Wellcome Collection w Londynie

Genom ludzki ma około 3,1 miliarda par zasad . Projekt Genomu Ludzkiego został rozpoczęty w 1990 roku w celu zsekwencjonowania i zidentyfikowania wszystkich par zasad w zestawie instrukcji genetycznych człowieka, znalezienia genetycznych korzeni choroby, a następnie opracowania terapii. Jest uważany za megaprojekt .

Genom został rozbity na mniejsze kawałki; około 150 000 par zasad . Kawałki te następnie zligowano z rodzajem wektora znanego jako „ sztuczne chromosomy bakteryjne ” lub BAC, które pochodzą z chromosomów bakteryjnych poddanych inżynierii genetycznej. Wektory zawierające geny można wprowadzać do bakterii, gdzie są one kopiowane przez bakteryjną maszynerię replikacji DNA . Każdy z tych elementów został następnie zsekwencjonowany osobno jako mały projekt „strzelby” , a następnie zmontowany. Większe, 150 000 par zasad łączą się, tworząc chromosomy. Jest to znane jako podejście „hierarchicznej strzelby” , ponieważ genom jest najpierw dzielony na stosunkowo duże kawałki, które są następnie mapowane na chromosomy, zanim zostaną wybrane do sekwencjonowania.

Fundusze pochodziły od rządu USA za pośrednictwem National Institutes of Health w Stanach Zjednoczonych oraz brytyjskiej organizacji charytatywnej Wellcome Trust , a także wielu innych grup z całego świata. Finansowanie wsparło wiele dużych ośrodków sekwencjonowania, w tym te w Whitehead Institute , Wellcome Sanger Institute (wtedy zwanym The Sanger Centre) z siedzibą w Wellcome Genome Campus , Washington University w St. Louis i Baylor College of Medicine .

Organizacja Narodów Zjednoczonych do spraw Oświaty, Nauki i Kultury (UNESCO) służyła jako ważny kanał zaangażowania krajów rozwijających się w Projekt Genomu Ludzkiego.

Publiczne a prywatne podejście

W 1998 roku amerykański badacz Craig Venter i jego firma Celera Genomics rozpoczęli podobną, prywatnie finansowaną misję . Venter był naukowcem w NIH na początku lat 90., kiedy projekt został zainicjowany. Wysiłek Celery o wartości 300 milionów dolarów miał przebiegać w szybszym tempie i za ułamek kosztów projektu finansowanego ze środków publicznych o wartości około 3 miliardów dolarów . Podejście Celera było w stanie przebiegać znacznie szybciej i przy niższych kosztach niż projekt publiczny. Chociaż korzystał z publicznie dostępnych map w GeneBank, były one niskiej jakości i tylko spowalniały projekt.

Celera zastosowała technikę zwaną sekwencjonowaniem całego genomu metodą shotgun , wykorzystującą sekwencjonowanie parami końców , która została wykorzystana do sekwencjonowania genomów bakteryjnych o długości do sześciu milionów par zasad, ale nie w przypadku niczego tak dużego jak ludzki genom wynoszący trzy miliardy par zasad.

Celera początkowo zapowiedziała, że ​​będzie starać się o ochronę patentową „tylko 200–300” genów, ale później zmieniła to na poszukiwanie „ochrony własności intelektualnej” na „w pełni scharakteryzowanych ważnych strukturach” w liczbie 100–300 celów. Firma ostatecznie złożyła wstępne ("właścicielem zastępczym") wnioski patentowe dotyczące 6500 całych lub częściowych genów. Celera obiecała również opublikować swoje odkrycia zgodnie z warunkami „ Oświadczenia bermudzkiego ” z 1996 r. , publikując co roku nowe dane (HGP codziennie publikuje nowe dane), chociaż, w przeciwieństwie do projektu finansowanego ze środków publicznych, nie pozwolą na bezpłatną redystrybucję lub naukowe wykorzystanie danych. Z tego powodu konkurenci finansowani ze środków publicznych zostali zmuszeni do wydania pierwszego szkicu ludzkiego genomu przed Celera. 7 lipca 2000 roku UCSC Genome Bioinformatics Group opublikowała pierwszą roboczą wersję roboczą w sieci. Społeczność naukowa pobrała około 500 GB informacji z serwera genomowego UCSC w ciągu pierwszych 24 godzin bezpłatnego i nieograniczonego dostępu.

W marcu 2000 roku prezydent Clinton wraz z premierem Tonym Blairem w podwójnym oświadczeniu nalegali, aby sekwencja genomu miała „nieograniczony dostęp” dla wszystkich badaczy, którzy chcą zbadać sekwencję. Oświadczenie spowodowało gwałtowny spadek akcji spółki Celera i zepchnęło w dół ciężki biotechnologiczny Nasdaq . Sektor biotechnologiczny stracił około 50 miliardów dolarów w kapitalizacji rynkowej w ciągu dwóch dni.

Chociaż projekt roboczy został ogłoszony w czerwcu 2000 roku, dopiero w lutym 2001 roku Celera i naukowcy z HGP opublikowali szczegóły swoich projektów. Specjalne wydania magazynu Nature (które opublikowały artykuł naukowy finansowanego ze środków publicznych projektu ) opisywały metody użyte do stworzenia szkicu sekwencji i oferowały analizę sekwencji. Szkice te obejmowały około 83% genomu (90% regionów euchromatycznych ze 150 000 przerwami oraz nieustaloną jeszcze kolejnością i orientacją wielu segmentów). W lutym 2001 r., w momencie wspólnych publikacji, w komunikatach prasowych podano, że projekt został zrealizowany przez obie grupy. Ulepszone wersje robocze zostały ogłoszone w 2003 i 2005 roku, wypełniając obecnie około 92% sekwencji.

Dawcy genomu

W międzynarodowym HGP sektora publicznego IHGSC naukowcy pobrali próbki krwi (kobiety) lub nasienia (mężczyźni) od dużej liczby dawców. Tylko kilka z wielu pobranych próbek zostało przetworzonych jako zasoby DNA. W ten sposób tożsamość dawcy była chroniona, aby ani dawcy, ani naukowcy nie mogli wiedzieć, czyje DNA zostało zsekwencjonowane. W całym projekcie wykorzystano klony DNA pobrane z wielu różnych bibliotek , przy czym większość z nich została stworzona przez Pietera J. de Jonga . Duża część sekwencji (>70%) genomu referencyjnego wytworzonego przez publiczne HGP pochodziła od pojedynczego anonimowego męskiego dawcy z Buffalo w stanie Nowy Jork ( nazwa kodowa RP11; „RP” odnosi się do Kompleksowego Centrum Raka Roswell Park ).

Naukowcy HGP wykorzystali białe krwinki z krwi dwóch dawców płci męskiej i dwóch żeńskich (losowo wybranych spośród 20 każdego) – każdy dawca dał osobną bibliotekę DNA. Jedna z tych bibliotek (RP11) była używana znacznie częściej niż inne, ze względu na względy jakości. Jednym z drobnych problemów technicznych jest to, że próbki męskie zawierają nieco ponad połowę mniej DNA z chromosomów płci (jeden chromosom X i jeden chromosom Y ) w porównaniu z próbkami kobiecymi (które zawierają dwa chromosomy X ). Pozostałe 22 chromosomy (autosomy) są takie same dla obu płci.

Chociaż główna faza sekwencjonowania HGP została zakończona, badania zmienności DNA były kontynuowane w Międzynarodowym Projekcie HapMap , którego celem było zidentyfikowanie wzorców grup polimorfizmu pojedynczego nukleotydu (SNP) (zwanych haplotypami lub „hapsami”). Próbki DNA do HapMap pochodziły od łącznie 270 osób; Jorubowie w Ibadan , Nigerii ; Japończycy w Tokio ; Chińczyk Han w Pekinie ; oraz francuskie zasoby Centre d'Etude du Polymorphisme Humain (CEPH), które składały się z mieszkańców Stanów Zjednoczonych mających pochodzenie z Europy Zachodniej i Północnej .

W projekcie sektora prywatnego Celera Genomics do sekwencjonowania wykorzystano DNA pięciu różnych osób. Główny naukowiec Celera Genomics w tym czasie, Craig Venter, przyznał później (w publicznym liście do czasopisma Science ), że jego DNA było jedną z 21 próbek w puli, z których pięć zostało wybranych do użycia.

Rozwój

Mając przygotowaną sekwencję, następnym krokiem było zidentyfikowanie wariantów genetycznych, które zwiększają ryzyko pospolitych chorób, takich jak rak i cukrzyca.

Oczekuje się , że szczegółowa wiedza na temat ludzkiego genomu otworzy nowe drogi postępu w medycynie i biotechnologii . Wyraźne praktyczne rezultaty projektu pojawiły się jeszcze przed zakończeniem prac. Na przykład wiele firm, takich jak Myriad Genetics , zaczęło oferować łatwe sposoby przeprowadzania testów genetycznych, które mogą wykazywać predyspozycje do różnych chorób, w tym raka piersi , zaburzeń hemostazy , mukowiscydozy , chorób wątroby i wielu innych. Również etiologii dla nowotworów , choroby Alzheimera i innych obszarów zainteresowania klinicznego są uważane za prawdopodobne, aby korzystać z genomu informacji i ewentualnie może doprowadzić w dłuższej perspektywie do znacznych postępów w zarządzaniu nimi.

Istnieje również wiele wymiernych korzyści dla biologów. Na przykład badacz badający pewną formę raka mógł zawęzić poszukiwania do konkretnego genu. Odwiedzając bazę danych ludzkiego genomu w sieci World Wide Web , badacz ten może sprawdzić, co inni naukowcy napisali o tym genie, w tym (potencjalnie) trójwymiarową strukturę jego produktu, jego funkcję (funkcje), jego ewolucyjne relacje z innymi ludźmi genów lub genów myszy, drożdży lub muszek owocowych, możliwych szkodliwych mutacji, interakcji z innymi genami, tkanek organizmu, w których ten gen jest aktywowany, oraz chorób związanych z tym genem lub innymi typami danych. Co więcej, głębsze zrozumienie procesów chorobowych na poziomie biologii molekularnej może determinować nowe procedury terapeutyczne. Biorąc pod uwagę ustalone znaczenie DNA w biologii molekularnej i jego centralną rolę w określaniu fundamentalnego działania procesów komórkowych , prawdopodobne jest, że poszerzona wiedza w tej dziedzinie ułatwi postępy medyczne w wielu obszarach zainteresowania klinicznego, które bez nich mogłyby nie być możliwe.

Analiza podobieństw między sekwencjami DNA z różnych organizmów otwiera również nowe możliwości w badaniach nad ewolucją . W wielu przypadkach pytania ewolucyjne można teraz sformułować w kategoriach biologii molekularnej ; w rzeczywistości wiele ważnych etapów ewolucji (pojawienie się rybosomu i organelli , rozwój embrionów z planami budowy ciała, układ odpornościowy kręgowców ) można powiązać z poziomem molekularnym. Wiele pytań dotyczących podobieństw i różnic między ludźmi a naszymi najbliższymi krewnymi ( naczelnymi i innymi ssakami ) zostanie wyjaśnionych przez dane zawarte w tym projekcie.

Projekt zainspirował i utorował drogę do prac genomicznych w innych dziedzinach, takich jak rolnictwo. Na przykład, badając skład genetyczny Tritium aestivum , najczęściej używanej pszenicy chlebowej na świecie, uzyskano wspaniały wgląd w to, w jaki sposób udomowienie wpłynęło na ewolucję rośliny. Bada się, które loci są najbardziej podatne na manipulacje i jak to się rozgrywa w kategoriach ewolucyjnych. Sekwencjonowanie genetyczne pozwoliło po raz pierwszy odpowiedzieć na te pytania, ponieważ konkretne loci można porównać w dzikich i udomowionych szczepach rośliny. Pozwoli to w przyszłości na postęp w modyfikacji genetycznej, która może przynieść m.in. zdrowsze i odporne na choroby plony pszenicy.

Kwestie etyczne, prawne i społeczne

Na początku Projektu Ludzkiego Genomu podniesiono kilka etycznych, prawnych i społecznych obaw dotyczących tego, w jaki sposób można wykorzystać większą wiedzę o ludzkim genomie do dyskryminowania ludzi . Jedną z głównych obaw większości osób była obawa, że ​​zarówno pracodawcy, jak i zakłady ubezpieczeń zdrowotnych odmówią zatrudnienia osób lub odmówią ubezpieczenia ludziom z powodu problemów zdrowotnych, na które wskazują czyjeś geny. W 1996 r. Stany Zjednoczone uchwaliły ustawę o przenośności i odpowiedzialności w ubezpieczeniach zdrowotnych (HIPAA), która chroni przed nieuprawnionym i nieupoważnionym udostępnianiem indywidualnie identyfikowalnych informacji zdrowotnych jakimkolwiek podmiotom, które nie są aktywnie zaangażowane w świadczenie usług opieki zdrowotnej na rzecz pacjenta. Inne narody nie przeszły takiej ochrony.

Oprócz identyfikacji wszystkich około 20 000–25 000 genów w ludzkim genomie (szacowanych na 80 000–140 000 na początku projektu), Human Genome Project starał się również rozwiązać problemy etyczne, prawne i społeczne, które zostały stworzone przez początek projektu. W tym celu w 1990 r. utworzono program Implikacje etyczne, prawne i społeczne (ELSI). Pięć procent rocznego budżetu przeznaczono na rozwiązanie problemu ELSI wynikającego z projektu. Budżet ten rozpoczął się od około 1,57 miliona dolarów w 1990 roku, ale wzrósł do około 18 milionów dolarów w roku 2014.

Chociaż projekt może przynieść znaczne korzyści medycynie i badaniom naukowym, niektórzy autorzy podkreślają potrzebę zajęcia się potencjalnymi społecznymi konsekwencjami mapowania ludzkiego genomu. „Choroby molekularne i ich możliwe wyleczenie będą miały głęboki wpływ na to, czego pacjenci oczekują od pomocy medycznej i postrzeganie choroby przez nowe pokolenie”.

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki

Prace według archiwum