단백질 데이터 뱅크

Protein Data Bank
단백질 데이터 뱅크
Wwpdb-logo.png
내용
묘사
연락
주요 인용문PMID 30357364
접근
data 형식mmCIF, PDB
웹 사이트

단백질 데이터 뱅크(PDB)[1]단백질과 핵산같은 큰 생물학적 분자의 3차원 구조 데이터를 위한 데이터베이스입니다.일반적으로 X선 결정학, NMR 분광학 또는 점점 더 많은 저온 전자 현미경을 통해 입수되고 전 세계의 생물학자생화학자들이 제출한 데이터는 회원 기관(PDBe,[2] PDBJ,[3] RCSB [4]및 BMRB[5])의 웹사이트를 통해 인터넷에서 자유롭게 액세스할 수 있다.PDB는 Worldwide Protein Data Bank, wwPDB라는 조직이 감독하고 있습니다.

PDB는 구조유전체학구조생물학 분야의 핵심이다.대부분의 주요 과학 저널과 일부 자금 조달 기관은 현재 과학자들에게 구조 데이터를 PDB에 제출하도록 요구하고 있습니다.다른 많은 데이터베이스는 PDB에 축적된 단백질 구조를 사용한다.예를 들어, SCOP와 CATH는 단백질 구조를 분류하는 반면, PDBSum은 Gene [6][7]Ontology와 같은 다른 소스의 정보를 사용하여 PDB 엔트리의 그래픽 개요를 제공합니다.

역사

PDB를 시작하기 위해 두 가지 힘이 모였다. X선 회절에 의해 결정되는 단백질 구조 데이터 세트의 작지만 증가하는 수집과 이러한 단백질 구조를 3-D로 시각화하기 위해 새롭게 이용 가능한 (1968년) 분자 그래픽 디스플레이인 Brookhaven RAster Display(BRAD)이다.1969년 브룩헤이븐 국립연구소의 월터 해밀턴의 후원으로 에드거 마이어(텍사스 A&M 대학)는 기하학적 및 그래픽 평가에 사용할 수 있도록 원자 좌표 파일을 공통 형식으로 저장하는 소프트웨어를 만들기 시작했다.1971년까지, Meyer의 프로그램 중 하나인 SEARCH는 연구자들이 오프라인에서 [8]단백질 구조를 연구하기 위해 데이터베이스의 정보에 원격으로 접근할 수 있게 했다.SEARCH는 네트워킹을 활성화하는 데 중요했고, 따라서 PDB의 기능 시작을 표시했습니다.

단백질 데이터 은행은 1971년 10월 네이처 뉴[9] 바이올로지 에서 영국 케임브리지 크리스털로지 데이터 센터와 미국 브룩헤이븐 국립 연구소의 합작기업으로 발표되었습니다.

1973년 해밀턴이 사망하자 톰 코즐은 이후 20년간 PDB의 지휘권을 이어받았다.1994년 1월 이스라엘 바이즈만 과학연구소의 Joel Sussman이 PDB의 수장으로 임명되었습니다.1998년 [10]10월 PDB는 구조생물정보학 연구협동조합(RCSB)[11]으로 이전되었으며, 1999년 6월에 이전이 완료되었다.새 감독은 헬렌 M이었다. Rutgers University의 Berman(RCSB의 관리 기관 중 하나이며, 다른 하나UC San [12]DiegoSan Diego Supercomputer Center).2003년 wwPDB의 발족으로 PDB는 국제기구가 되었다.창립 멤버는 PDBe(유럽),[2] RCSB(미국), PDBJ(일본)[3]이다.BMRB[5] 2006년에 가입했다.wwPDB의 4개 멤버는 각각 PDB 데이터의 증착, 데이터 처리 및 전달 센터로서 기능할 수 있습니다.데이터 처리란 wwPDB 직원이 제출된 각 [13]엔트리를 검토하고 주석을 다는 것을 말합니다.그런 다음 데이터의 신뢰성을 자동으로 점검합니다(이 검증 소프트웨어의 소스[14] 코드는 무료로 일반에 공개됨).

내용물

PDB(UCSF 키메라로 생성)의 단백질 구조 예
방법 및 연도에 따른 단백질 구조 결정 속도.MX = 고분자 결정학, 3DEM = 3D Electron Microscopy.[15]

PDB 데이터베이스는 보유 목록과 함께 매주(UTC+0 수요일) 업데이트됩니다.[16]2020년 4월 1일 현재 PDB는 다음과 같이 구성되어 있습니다.

실험적인
방법
단백질 핵산 단백질/핵산
콤플렉스
다른.
X선 회절 135170 2097 6945 4 144216
NMR 11337 1325 264 8 12934
전자 현미경 검사 3475 35 1136 0 4646
하이브리드 155 5 3 1 164
다른. 286 4 6 13 309
합계: 150423 3466 8354 26 162269
PDB의 134,146개의 구조에는 구조 요소 파일이 있습니다.
10,289개의 구조물에 NMR 구속 파일이 있다.
PDB의 4,814개의 구조물에 화학 교대 파일이 있습니다.
PDB의 4,718개의 구조물에 3DEM 지도 파일이 EM Data Bank에 보관되어 있습니다.

대부분의 구조는 X선 회절에 의해 결정되지만, 구조의 약 10%는 단백질 NMR에 의해 결정된다. X선 회절을 사용하면 단백질 원자의 좌표 근사치를 얻을 수 있으며, NMR을 사용하면 단백질의 원자 쌍 사이의 거리를 추정할 수 있다.단백질의 최종 배치는 거리 기하학 문제를 해결함으로써 NMR로부터 얻어진다.2013년 이후에는 극저온전자현미경법에 의해 단백질의 수가 증가하고 있다.링크된 외부 테이블의 숫자를 클릭하면 해당 방법으로 결정된 구조의 예가 표시됩니다.

구조요소 파일을 가진 X선 회절에 의해 결정되는 PDB 구조의 경우 전자밀도맵을 볼 수 있다.이러한 구조의 데이터는 "전자 밀도 서버"[17][18]에 저장됩니다.

지금까지 PDB의 구조물 수는 1982년 100개, 1993년 1,000개, 1999년 10,000개, 2014년 [19][20]10만개로 거의 기하급수적으로 증가해 왔습니다.

파일 형식

PDB가 처음에 사용한 파일 형식을 PDB 파일 형식이라고 합니다.원래 형식은 컴퓨터 펀치 카드의 너비에 의해 한 줄에 80자로 제한되었습니다.1996년경, "대분자 결정 정보 파일" 형식인 mmCIF가 CIF 형식의 확장자로 단계적으로 도입되었습니다.[21] mmCIF는 2014년에 PDB 아카이브의 표준 형식이 되었습니다.2019년 wwPDB는 결정학적 방법에 대한 기탁을 mmCIF [22]형식으로만 접수한다고 발표했다.

PDB의 XML 버전인 PDBML은 [23]2005년에 설명되었습니다.구조 파일은 이러한 세 가지 형식 중 하나로 다운로드할 수 있지만, 기존 PDB 형식에 맞지 않는 구조가 증가하고 있습니다.개별 파일은 인터넷 URL에서 그래픽 패키지로 쉽게 다운로드 할 수 있습니다.

  • PDB 형식 파일의 경우 다음과 같이 사용합니다.http://www.pdb.org/pdb/files/4hhb.pdb.gz또는http://pdbe.org/download/4hhb
  • PDBML(XML) 파일의 경우 다음을 사용합니다.http://www.pdb.org/pdb/files/4hhb.xml.gz또는http://pdbe.org/pdbml/4hhb

"4hhb" 는 PDB ID 입니다.PDB에 게재된 각 구조에는 4글자의 영숫자 식별자(PDB ID)가 할당되어 있습니다(다른 환경 또는 구성의 동일한 분자에 대한 여러 구조가 PDB에 다른 PDB ID로 포함될 수 있기 때문에 이는 생체 분자의 고유 식별자가 아닙니다).

데이터 표시

구조 파일은 Jmol, Pymol, VMDRasmol을 포함한 몇 가지 자유오픈 소스 컴퓨터 프로그램하나를 사용하여 볼 수 있습니다.무료가 아닌 다른 쉐어웨어 프로그램에는 [24]ICM-Browser, MDL Chime, UCSF Chimera, Swiss-PDB [25]Viewer[26], StarBichem(단백질 데이터뱅크 통합 검색 기능을 갖춘 Java 기반 인터랙티브 분자 뷰어), Sirius 및 VisProt3DS[27](3D 입체도)가 있습니다.RCSB PDB 웹사이트에는 무료 및 상용 분자 시각화 프로그램과 웹 브라우저 플러그인의 광범위한 목록이 포함되어 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ wwPDB, Consortium (2019). "Protein Data Bank: the single global archive for 3D macromolecular structure data". Nucleic Acids Res. 47 (D1): 520–528. doi:10.1093/nar/gky949. PMC 6324056. PMID 30357364.
  2. ^ a b "PDBe home < Node < EMBL-EBI". pdbe.org.
  3. ^ a b "Protein Data Bank Japan - PDB Japan - PDBj". pdbj.org.
  4. ^ Bank, RCSB Protein Data. "RCSB PDB: Homepage". rcsb.org.
  5. ^ a b "Biological Magnetic Resonance Bank". bmrb.wisc.edu.
  6. ^ Berman, H. M. (January 2008). "The Protein Data Bank: a historical perspective" (PDF). Acta Crystallographica Section A. A64 (1): 88–95. doi:10.1107/S0108767307035623. PMID 18156675.
  7. ^ Laskowski RA, Hutchinson EG, Michie AD, Wallace AC, Jones ML, Thornton JM (December 1997). "PDBsum: a Web-based database of summaries and analyses of all PDB structures". Trends Biochem. Sci. 22 (12): 488–90. doi:10.1016/S0968-0004(97)01140-7. PMID 9433130.
  8. ^ Meyer EF (1997). "The first years of the Protein Data Bank". Protein Science. Cambridge University Press. 6 (7): 1591–1597. doi:10.1002/pro.5560060724. PMC 2143743. PMID 9232661.
  9. ^ "Protein Data Bank". Nature New Biology. 233. 1971. doi:10.1038/newbio233223b0.
  10. ^ Berman HM, Westbrook J, Feng Z, Gilliland G, Bhat TN, Weissig H, Shindyalov IN, Bourne PE (January 2000). "The Protein Data Bank". Nucleic Acids Res. 28 (1): 235–242. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
  11. ^ "Research Collaboratory for Structural Bioinformatics". RCSB.org. Research Collaboratory for Structural Bioinformatics. Archived from the original on 2007-02-05.
  12. ^ "RCSB PDB Newsletter Archive". RCSB Protein Data Bank.
  13. ^ Curry E, Freitas A, O'Riáin S (2010). "The Role of Community-Driven Data Curation for Enterprises". In D. Wood (ed.). Linking Enterprise Data. Boston: Springer US. pp. 25–47. ISBN 978-1-441-97664-2.
  14. ^ "PDB Validation Suite". sw-tools.pdb.org.
  15. ^ Burley SK, Berman HM, Bhikadiya C, Bi C, Chen L, Costanzo LD, et al. (wwPDB consortium) (January 2019). "Protein Data Bank: the single global archive for 3D macromolecular structure data". Nucleic Acids Research. 47 (D1): D520–D528. doi:10.1093/nar/gky949. PMC 6324056. PMID 30357364.
  16. ^ "PDB Current Holdings Breakdown". RCSB.
  17. ^ "The Uppsala Electron Density Server". Uppsala University. Retrieved 2013-04-06.
  18. ^ Kleywegt GJ, Harris MR, Zou JY, Taylor TC, Wählby A, Jones TA (Dec 2004). "The Uppsala Electron-Density Server". Acta Crystallogr D. 60 (Pt 12 Pt 1): 2240–2249. doi:10.1107/S0907444904013253. PMID 15572777.
  19. ^ Anon (2014). "Hard data: It has been no small feat for the Protein Data Bank to stay relevant for 100,000 structures". Nature. 509 (7500): 260. doi:10.1038/509260a. PMID 24834514.
  20. ^ "Content Growth Report". RCSB PDB. Archived from the original on 2007-04-28. Retrieved 2013-04-06.
  21. ^ "wwPDB: File Formats and the PDB". wwpdb.org. Retrieved April 1, 2020.
  22. ^ wwPDB.org. "wwPDB: 2019 News". wwpdb.org.
  23. ^ Westbrook J, Ito N, Nakamura H, Henrick K, Berman HM (April 2005). "PDBML: the representation of archival macromolecular structure data in XML". Bioinformatics. 21 (7): 988–992. doi:10.1093/bioinformatics/bti082. PMID 15509603.
  24. ^ "ICM-Browser". Molsoft L.L.C. Retrieved 2013-04-06.
  25. ^ "Swiss PDB Viewer". Swiss Institute of Bioinformatics. Retrieved 2013-04-06.
  26. ^ "STAR: Biochem - Home". web.mit.edu.
  27. ^ "VisProt3DS". Molecular Systems Ltd. Retrieved 2013-04-06.

외부 링크