Bank danych białka - Protein Data Bank

Bank danych białka
Wwpdb-logo.png
Treść
Opis
Kontakt
Cytat podstawowy PMID  30357364
Dostęp
Format danych mmCIF , WPB
Stronie internetowej

Protein Data Bank ( PDB ) jest bazą danych do trójwymiarowych danych strukturalnych dużych cząsteczek biologicznych, takich jak białka i kwasów nukleinowych . Dane, zwykle uzyskiwane za pomocą krystalografii rentgenowskiej , spektroskopii NMR lub, w coraz większym stopniu, mikroskopii krioelektronowej , i przesłane przez biologów i biochemików z całego świata, są swobodnie dostępne w Internecie za pośrednictwem stron internetowych organizacji członkowskich (PDBe, PDBj, RCSB i BMRB). PDB jest nadzorowany przez organizację o nazwie Worldwide Protein Data Bank , wwPDB.

WPB ma kluczowe znaczenie w dziedzinach biologii strukturalnej , takich jak genomika strukturalna . Większość głównych czasopism naukowych i niektóre agencje finansujące wymagają obecnie, aby naukowcy przesyłali swoje dane dotyczące struktury do PDB. Wiele innych baz danych wykorzystuje struktury białkowe zdeponowane w PDB. Na przykład SCOP i CATH klasyfikują struktury białkowe, podczas gdy PDBsum zapewnia graficzny przegląd wpisów PDB przy użyciu informacji z innych źródeł, takich jak ontologia genów .

Historia

Dwie siły zbiegły się, aby zainicjować PDB: mały, ale rosnący zbiór zestawów danych dotyczących struktury białka określonych za pomocą dyfrakcji promieni rentgenowskich; oraz nowo dostępny (1968) wyświetlacz grafiki molekularnej, Brookhaven RAster Display (BRAD), do wizualizacji tych struktur białkowych w 3D. W 1969 roku, pod patronatem Waltera Hamiltona z Brookhaven National Laboratory , Edgar Meyer ( Texas A&M University ) zaczął pisać oprogramowanie do przechowywania plików współrzędnych atomowych we wspólnym formacie, aby były dostępne do oceny geometrycznej i graficznej. W 1971 roku jeden z programów Meyera, SEARCH, umożliwił naukowcom zdalny dostęp do informacji z bazy danych w celu badania struktur białkowych offline. SEARCH odegrał kluczową rolę w umożliwieniu tworzenia sieci, wyznaczając w ten sposób funkcjonalny początek PDB.

Protein Data Bank został ogłoszony w październiku 1971 w Nature New Biology jako wspólne przedsięwzięcie Cambridge Crystallographic Data Center w Wielkiej Brytanii i Brookhaven National Laboratory w USA.

Po śmierci Hamiltona w 1973, Tom Koeztle przejął kierownictwo PDB na kolejne 20 lat. W styczniu 1994 r. szefem PDB został Joel Sussman z izraelskiego Instytutu Nauki Weizmanna . W październiku 1998, PDB został przeniesiony do Research Collaboratory for Structural Bioinformatics (RCSB); przeniesienie zostało zakończone w czerwcu 1999 roku. Nowym dyrektorem została Helen M. Berman z Rutgers University (jedna z instytucji zarządzających RCSB, druga to San Diego Supercomputer Center na UC San Diego ). W 2003 roku, wraz z utworzeniem wwPDB, PDB stała się organizacją międzynarodową. Członkami założycielami są PDBe (Europa), RCSB (USA) i PDBj (Japonia). Do BMRB dołączyła w 2006 roku. Każdy z czterech członków wwPDB może pełnić funkcję centrów deponowania, przetwarzania i dystrybucji danych PDB. Przetwarzanie danych polega na tym, że pracownicy wwPDB sprawdzają i dodają adnotacje do każdego przesłanego wpisu. Dane są następnie automatycznie sprawdzane pod kątem wiarygodności (kod źródłowy tego oprogramowania weryfikacyjnego został udostępniony publicznie bezpłatnie).

Zawartość

Przykłady struktur białkowych z PDB (utworzone za pomocą UCSF Chimera)
Szybkość wyznaczania struktury białka według metody i roku. MX = krystalografia makromolekularna , 3DEM = mikroskopia elektronowa 3D .

Baza danych PDB jest aktualizowana co tydzień (w środę UTC +0) wraz z listą zasobów. Na dzień 1 kwietnia 2020 r. WPB obejmował:


Metoda eksperymentalna
Białka Kwasy nukleinowe
Kompleksy białek/kwasów nukleinowych
Inne Całkowity
Dyfrakcja rentgenowska 135170 2097 6945 4 144216
NMR 11337 1325 264 8 12934
Mikroskopia elektronowa 3475 35 1136 0 4646
Hybrydowy 155 5 3 1 164
Inne 286 4 6 13 309
Całkowity: 150423 3466 8354 26 162269
134 146 struktur w PDB ma plik współczynników struktury .
10 289 struktur ma plik unieruchamiający NMR.
4814 struktur w PDB ma plik przesunięć chemicznych .
4718 struktur w PDB ma plik mapy 3DEM zdeponowany w EM Data Bank

Większość struktur określa się metodą dyfrakcji rentgenowskiej, ale około 10% struktur określa się metodą NMR białka . Przy zastosowaniu dyfrakcji rentgenowskiej uzyskuje się przybliżenia współrzędnych atomów białka, natomiast przy użyciu NMR szacuje się odległość między parami atomów białka. Ostateczną konformację białka uzyskuje się z NMR, rozwiązując problem geometrii odległości . Po 2013 roku coraz więcej białek jest oznaczanych za pomocą mikroskopii krioelektronowej . Kliknięcie na liczby w połączonej tabeli zewnętrznej wyświetla przykłady struktur określonych tą metodą.

W przypadku struktur PDB określonych za pomocą dyfrakcji rentgenowskiej, które mają plik współczynników struktury, można wyświetlić ich mapę gęstości elektronowej. Dane takich struktur są przechowywane na „serwerze gęstości elektronowej”.

Historycznie liczba struktur w WPB rosła w tempie w przybliżeniu wykładniczym: 100 zarejestrowanych struktur w 1982 r., 1000 struktur w 1993 r., 10 000 w 1999 r. i 100 000 w 2014 r.

Format pliku

Format pliku początkowo używany przez PDB został nazwany formatem pliku PDB. Oryginalny format był ograniczony szerokością komputerowych kart dziurkowanych do 80 znaków w wierszu. Około 1996 roku wprowadzono stopniowo format „makromolekularnego pliku informacji krystalograficznej”, mmCIF, który jest rozszerzeniem formatu CIF . mmCIF stał się standardowym formatem archiwum PDB w 2014 roku. być akceptowane tylko w formacie mmCIF.

Wersja XML PDB, zwana PDBML, została opisana w 2005 roku. Pliki struktur można pobrać w dowolnym z tych trzech formatów, chociaż coraz więcej struktur nie pasuje do starszego formatu PDB. Poszczególne pliki można łatwo pobrać do pakietów graficznych z internetowych adresów URL :

  • W przypadku plików w formacie PDB użyj np. http://www.pdb.org/pdb/files/4hhb.pdb.gzlubhttp://pdbe.org/download/4hhb
  • W przypadku plików PDBML (XML) użyj np. http://www.pdb.org/pdb/files/4hhb.xml.gzlubhttp://pdbe.org/pdbml/4hhb

4hhb” to identyfikator PDB. Każda struktura opublikowana w PDB otrzymuje czteroznakowy identyfikator alfanumeryczny, swój PDB ID. (Nie jest to unikalny identyfikator biocząsteczek, ponieważ kilka struktur tej samej cząsteczki — w różnych środowiskach lub konformacjach — może być zawartych w PDB z różnymi identyfikatorami PDB.)

Przeglądanie danych

Pliki struktury można przeglądać za pomocą jednego z kilku darmowych programów komputerowych o otwartym kodzie źródłowym , w tym Jmol , Pymol , VMD i Rasmol . Inne niewolne programy typu shareware to ICM-Browser, MDL Chime , UCSF Chimera , Swiss-PDB Viewer, StarBiochem (interaktywna przeglądarka molekularna oparta na Javie ze zintegrowanym przeszukiwaniem banku danych białek), Sirius i VisProt3DS (narzędzie do wizualizacji białek w stereoskopowym widoku 3D w trybie anaglifowym i innych) oraz Discovery Studio . Witryna RCSB PDB zawiera obszerną listę zarówno bezpłatnych, jak i komercyjnych programów do wizualizacji cząsteczek oraz wtyczek do przeglądarek internetowych.

Zobacz też

Bibliografia

Linki zewnętrzne