단백질 데이터 뱅크(파일 형식)
Protein Data Bank (file format)| 파일 이름 확장명 | .pdb, .ent, .brk |
|---|---|
| 인터넷 미디어 유형 | 화학/x-pdb |
| 형식 유형 | 화학 파일 형식 |
단백질 데이터 뱅크(pdb) 파일 형식은 단백질 데이터 뱅크에 있는 분자의 3차원 구조를 설명하는 텍스트 파일 형식이다.이에 따라 pdb 형식은 원자 좌표, 이차 구조 할당 및 원자 연결을 포함한 단백질과 핵산 구조에 대한 설명과 주석을 제공한다.또한 실험 메타데이터가 저장된다.PDB 형식은 이제 생물학적 고분자에 대한 데이터를 최신 mmCIF 파일 형식으로 보관하는 단백질 데이터 뱅크의 레거시 파일 형식이다.
역사
PDB 파일 형식은 1976년 연구자가 데이터베이스 시스템을 통해 단백질 좌표를 교환할 수 있는 사람이 판독할 수 있는 파일로 발명됐다.고정기둥 폭 형식은 80열로 제한돼 기존에 좌표를 교환할 때 사용하던 컴퓨터 펀치 카드의 폭을 기준으로 했다.[1]수년간 파일 형식은 많은 변화와 수정을 거쳤다.2011년[update] 7월 13일 현재, 가장 최근의 개정은 3.30이다.[2]
예
단백질을 설명하는 일반적인 PDB 파일은 다음과 같은 수백에서 수천 개의 라인으로 구성된다(합성 콜라겐 유사 펩타이드의 구조를 설명하는 파일에서 추출).
헤더 세포외 매트릭스 22-JAN-98 1A3I 제목 X선 결정학적 반복 시퀀스(프로-프로-글리)가 포함된 콜라겐 유사 제목 2 펩타이드 결정판정...EXPDTA X-RAY 회절 저자 R.Z.크레이머, 엘비타글리아노, J벨라, R.베리시오, 엘마차렐라, 저자 2B.브로스키, 에이즈아가리, H.M.BERMAN...비고 350 생체 분자: 1 비고 350 비고 350 비고 1 1.000000 0.0000 0.0000 0.0000 비고 350 비고 1 0.0000 0.0000 비고 350 비고 2 0.0000 0.0000 …SEQRES 1 A 9 Pro GLI Pro GLI Pro GLI Pro GLI PLI PLI PLI 1 B 6 Pro GLI Pro GLI PLI PLI PLI 1 C 6 Pro GLI PLI ...ATOM 1 N PRO A 1 8.316 21.206 21.530 1.00 17.44 N ATOM 2 CA PRO A 1 7.608 20.729 20.336 1.00 17.44 C ATOM 3 C PRO A 1 8.487 20.707 19.092 1.00 17.44 C ATOM 4 O PRO A 1 9.466 21.457 19.005 1.00 17.44 O ATOM 5 CB PRO A 16.460 21.723 20.211 1.00 22.26 C ...HETATM 130 C ACY 401 3.682 22.541 11.236 1.00 21.19 C HETATM 131 O ACY 401 2.807 23.097 10.553 1.00 21.19 O HETATM 132 OXT ACY 401 4.306 23.101 12.291 1.00 21.19 O ...
- 머리글, 제목 및 작성자 레코드
- 구조를 정의한 연구원들에 대한 정보를 제공한다; 다른 유형의 정보를 제공하기 위해 수많은 다른 유형의 기록들을 이용할 수 있다.
- 리마인드 레코드
- 자유형 주석을 포함할 수 있지만 표준화된 정보(예:
REMARK 350 BIOMT기록에는 실험적으로 관찰된 멀티머의 좌표를 단일 반복 장치의 명시적으로 지정된 좌표에서 계산하는 방법이 설명된다. - SEQRES 레코드
- 세 개의 펩타이드 체인(이름 A, B, C)의 시퀀스를 제시한다. 이 예에서는 매우 짧지만 대개 여러 개의 라인에 걸쳐 있다.
- 아톰 레코드
- 단백질의 일부인 원자의 좌표를 설명하라.예를 들어, 위의 첫 번째 아톰 라인은 프롤라인 잔류물인 펩타이드 체인 A의 첫 번째 잔류물의 알파-N 원자를 설명한다. 첫 번째 3개의 부동소수 번호는 x, y, z 좌표이며 å스트룀의 단위에 있다.[3]다음 세 개의 열은 각각 점유율, 온도 계수, 요소 이름이다.
- HETATM 레코드
- 단백질 분자의 일부가 아닌 원자인 이성분자의 좌표를 설명한다.
PDB 파일을 표시할 수 있는 분자 시각화 소프트웨어
PDB 파일을 표시할 수 있는 3D 애니메이션 소프트웨어
참고 항목
- 화학 파일 형식
- ScientificPython — Python에 대한 인터페이스 제공
- 분자역학 모델링 소프트웨어
참조
- ^ Berman, Helen M. "단백질 데이터 뱅크: 역사적 관점"Acta Crystalographica 섹션 A 64.1(2007): 88-95.
- ^ "Atomic Coordinate Entry Format Version 3.3". wwPDB. July 2011.
- ^ "wwPDB Format version 3.3: Coordinate Section". Archived from the original on 2012-02-28. Retrieved 2012-03-23.
외부 링크
- PDB 형식 가이드 PDB 형식 지정의 현재 버전(3.3)이다.
- PDBML 분자 좌표를 위한 최신 대체 XML 기반 파일 형식.
- RCSB 단백질 데이터 뱅크
- 유럽의 단백질 데이터 뱅크
- NCBI의 MMDB(Molecular Modeling DataBase)
- wwPDB의 wwPDB 교정 프로젝트
- MakeMultimer pdb 파일의 BIOMT 레코드를 확장하기 위한 온라인 도구
- PDB 파일을 표시하는 분자 iPad/iPhone 앱
- Python Macromolecular Library(mmLib) - PDB 파일 형식을 읽고 쓸 수 있는 Python 라이브러리