단백질 데이터 뱅크(파일 형식)

Protein Data Bank (file format)
PDB
파일 이름 확장명
.pdb, .ent, .brk
인터넷 미디어 유형
화학/x-pdb
형식 유형화학 파일 형식

단백질 데이터 뱅크(pdb) 파일 형식단백질 데이터 뱅크에 있는 분자의 3차원 구조를 설명하는 텍스트 파일 형식이다.이에 따라 pdb 형식은 원자 좌표, 이차 구조 할당 및 원자 연결을 포함한 단백질과 핵산 구조에 대한 설명과 주석을 제공한다.또한 실험 메타데이터가 저장된다.PDB 형식은 이제 생물학적 고분자에 대한 데이터를 최신 mmCIF 파일 형식으로 보관하는 단백질 데이터 뱅크의 레거시 파일 형식이다.

역사

PDB 파일 형식은 1976년 연구자가 데이터베이스 시스템을 통해 단백질 좌표를 교환할 수 있는 사람이 판독할 수 있는 파일로 발명됐다.고정기둥 폭 형식은 80열로 제한돼 기존에 좌표를 교환할 때 사용하던 컴퓨터 펀치 카드의 폭을 기준으로 했다.[1]수년간 파일 형식은 많은 변화와 수정을 거쳤다.2011년 7월 13일 현재, 가장 최근의 개정은 3.30이다.[2]

단백질을 설명하는 일반적인 PDB 파일은 다음과 같은 수백에서 수천 개의 라인으로 구성된다(합성 콜라겐 유사 펩타이드의 구조를 설명하는 파일에서 추출).

헤더 세포외 매트릭스 22-JAN-98 1A3I 제목 X선 결정학적 반복 시퀀스(프로-프로-글리)가 포함된 콜라겐 유사 제목 2 펩타이드 결정판정...EXPDTA X-RAY 회절 저자 R.Z.크레이머, 엘비타글리아노, J벨라, R.베리시오, 엘마차렐라, 저자 2B.브로스키, 에이즈아가리, H.M.BERMAN...비고 350 생체 분자: 1 비고 350 비고 350 비고 1 1.000000 0.0000 0.0000 0.0000 비고 350 비고 1 0.0000 0.0000 비고 350 비고 2 0.0000 0.0000 …SEQRES 1 A 9 Pro GLI Pro GLI Pro GLI Pro GLI PLI PLI PLI 1 B 6 Pro GLI Pro GLI PLI PLI PLI 1 C 6 Pro GLI PLI ...ATOM      1  N   PRO A   1       8.316  21.206  21.530  1.00 17.44           N ATOM      2  CA  PRO A   1       7.608  20.729  20.336  1.00 17.44           C ATOM      3  C   PRO A   1       8.487  20.707  19.092  1.00 17.44           C ATOM      4  O   PRO A   1       9.466  21.457  19.005  1.00 17.44           O ATOM      5  CB  PRO A   16.460 21.723 20.211 1.00 22.26 C ...HETATM  130  C   ACY   401       3.682  22.541  11.236  1.00 21.19           C HETATM  131  O   ACY   401       2.807  23.097  10.553  1.00 21.19           O HETATM  132  OXT ACY   401       4.306  23.101  12.291  1.00 21.19           O ... 
머리글, 제목 및 작성자 레코드
구조를 정의한 연구원들에 대한 정보를 제공한다; 다른 유형의 정보를 제공하기 위해 수많은 다른 유형의 기록들을 이용할 수 있다.
리마인드 레코드
자유형 주석을 포함할 수 있지만 표준화된 정보(예:REMARK 350 BIOMT기록에는 실험적으로 관찰된 멀티머의 좌표를 단일 반복 장치의 명시적으로 지정된 좌표에서 계산하는 방법이 설명된다.
SEQRES 레코드
세 개의 펩타이드 체인(이름 A, B, C)의 시퀀스를 제시한다. 이 예에서는 매우 짧지만 대개 여러 개의 라인에 걸쳐 있다.
아톰 레코드
단백질의 일부인 원자의 좌표를 설명하라.예를 들어, 위의 첫 번째 아톰 라인은 프롤라인 잔류물인 펩타이드 체인 A의 첫 번째 잔류물의 알파-N 원자를 설명한다. 첫 번째 3개의 부동소수 번호는 x, y, z 좌표이며 å스트룀의 단위에 있다.[3]다음 세 개의 열은 각각 점유율, 온도 계수, 요소 이름이다.
HETATM 레코드
단백질 분자의 일부가 아닌 원자인 이성분자의 좌표를 설명한다.

PDB 파일을 표시할 수 있는 분자 시각화 소프트웨어

PDB 파일을 표시할 수 있는 3D 애니메이션 소프트웨어

참고 항목

참조

  1. ^ Berman, Helen M. "단백질 데이터 뱅크: 역사적 관점"Acta Crystalographica 섹션 A 64.1(2007): 88-95.
  2. ^ "Atomic Coordinate Entry Format Version 3.3". wwPDB. July 2011.
  3. ^ "wwPDB Format version 3.3: Coordinate Section". Archived from the original on 2012-02-28. Retrieved 2012-03-23.

외부 링크