인간 단백질 참조 데이터베이스
Human Protein Reference Database인간 단백질 참조 데이터베이스(HPRD)는 인터넷을 통해 접근할 수 있는 단백질 데이터베이스다.[1]null
개요
HPRD는 인도 뱅갈로르의 생물정보학 연구소와 미국 볼티모어에 있는 존스홉킨스 대학의 판디 연구소가 국제적으로 협력한 결과물이다.인간 질병과 관련된 단백질에 관한 정보는 주석을 달고 Online Mendelian Assistance in Man(OMIM) 데이터베이스와 연결된다.국립생명공학정보센터는 인간 단백질 데이터베이스(예: Entrez Gene, 유전자와 단백질에 관련된 RefSeq 단백질)를 통해 HPRD에 대한 링크를 제공한다.null
이 자료에는 단백질-단백질 상호작용, 변환 후 수정, 효소-하향 관계 및 질병 연관성을 포함한 인간 단백질 기능에 대한 정보가 묘사되어 있다.분류되는 단백질 주석 정보는 전문 생물학자가 출판한 문헌을 이용한 수동 큐레이션과 단백질 서열에 대한 생물정보학 분석을 통해 도출되었다.HPRD의 단백질-단백질 상호작용과 세포하위 국산화 데이터는 인간 단백질 상호작용 네트워크를 개발하는 데 사용되어 왔다.[2]null
HPRD의 주요 내용은 다음과 같다.
- 2003년 3,000개의 단백질에 대해 주석을 달았던 10,000개의 단백질-단백질 상호작용(PPI)으로부터, HPRD는 2007년 말까지 6,360개의 이소폼을 포함하여 25,000개의 단백질에 대해 주석을 달았던 36,500개 이상의 고유 PPI로 성장했다.[3]
- HPRD로 주석 처리된 분자의 50% 이상은 최소 1개의 PPI를 가지고 있으며 10%는 10개 이상의 PPI를 가지고 있다.
- PPI에 대한 실험은 크게 체외, 체내 및 효모 2 하이브리드(Y2H)의 세 가지 범주로 분류된다.HPRD로 주석을 단 PPI의 60%는 단일 실험으로 지지되는 반면 26%는 3가지 실험 방법 중 2가지에 주석을 달았다.
- HPRD는 26개의 다른 유형에 속하는 18,000개의 수동으로 큐레이션된 PTM 데이터를 포함하고 있다.인산화(phosphorylation)는 HPRD에 주석을 단 PTM 데이터의 63%에 기여하는 단백질의 주요 변형 유형이다.글리코실화, 단백질 분해 및 이황화 교량 이벤트는 PTM 데이터의 차세대 주요 기여자.
- HPRD 데이터는 탭 구분 및 XML 파일 형식으로 다운로드할 수 있다.[4]
또한 HPRD는 인간 단백질 데이터를 통합하기 위한 커뮤니티 포털인 휴먼 단백질피디아(Human Stephantpedia)의 데이터를 통합한다.HPRD의 데이터는 학계 이용자들이 자유롭게 접근하여 사용할 수 있으며, 상인들은 사용허가를 받아야 한다.휴먼 프로틴페디아[5] 함량은 누구나 자유롭게 다운로드하여 사용할 수 있다.null
인광모티프 파인더
PhosphoMotif Finder는[6] 알려진 키나제/인산아제 기질뿐만 아니라 출판된 문헌으로부터 큐레이션된 결합 모티브를 포함하고 있다.그것은 질의 순서에서 문헌에서 파생된 모티브의 존재를 보고한다.PhosphoMotif Finder는 어떤 알고리즘이나 다른 계산 전략을 사용하여 질의 단백질 시퀀스의 어떤 모티브도 예측하지 않는다.null
단백질 데이터 비교
인간 프로테오메(예: BioGRID, BIND, DIP, HPRD, IntAct, MINT, MIPS, PDZZase, Reactome)를 다루는 다른 데이터베이스도 있다.각 데이터베이스는 데이터를 표시하는 고유한 스타일을 가지고 있다.각 데이터베이스의 장단점을 결론짓기 위해 대부분의 조사자가 이들 데이터베이스의 방대한 데이터를 비교하는 것은 어려운 작업이다.마티바난과 동료들은 단백질 데이터를 분석하면서 다양한 질문을 던지며 이 문제를 해결하려 했다.이 분석은 생물학자들이 그들의 필요에 따라 이러한 데이터베이스들 중에서 선택할 수 있도록 도울 것이다.null
참조
- ^ Peri S, et al. (2003). "Development of human protein reference database as an initial platform for approaching systems biology in humans". Genome Research. 13 (10): 2363–71. doi:10.1101/gr.1680803. PMC 403728. PMID 14525934.
- ^ Gandhi T.K.B.; et al. (March 2006). "Analysis of the human protein interactome and comparison with yeast, worm and fly interaction datasets". Nature Genetics. 38 (3): 285–293. doi:10.1038/ng1747. PMID 16501559. S2CID 1446423.
- ^ Mathivanan S.; et al. (2006). "An evaluation of human protein–protein interaction data in the public domain". BMC Bioinformatics. 2006 (7): S19. doi:10.1186/1471-2105-7-s5-s19. PMC 1764475. PMID 17254303.
- ^ Mishra G.; et al. (2006). "Human protein reference database—2006 update". Nucleic Acids Research. 34 (Database issue): 411–414. doi:10.1093/nar/gkj141. PMC 1347503. PMID 16381900.
- ^ Mathivanan S.; et al. (2008). "Human Proteinpedia enables sharing of human protein data" (PDF). Nature Biotechnology. 26 (2): 164–167. doi:10.1038/nbt0208-164. hdl:10261/60528. PMID 18259167. S2CID 205265347.
- ^ Amanchy R.; et al. (2007). "A compendium of curated phosphorylation-based substrate and binding motifs". Nature Biotechnology. 2007 (25): 285–286. doi:10.1038/nbt0307-285. PMID 17344875. S2CID 38824337.
- ^ Mathivanan S, Periaswamy B, Gandhi TK, et al. (2006). "An evaluation of human protein-protein interaction data in the public domain". BMC Bioinformatics. 7 Suppl 5: S19. doi:10.1186/1471-2105-7-S5-S19. PMC 1764475. PMID 17254303.