계통학적 프로파일링

Phylogenetic profiling

계통학적 프로파일링생물정보학 기법으로, 동일한 생물학적 경로에서 두 가지 다른 단백질의 관여와 같은 의미 있는 생물학적 연관성을 추론하기 위해 많은 수의 종에 걸친 두 가지 특성의 결합 유무를 사용한다.보존된 신테니, 보존된 오퍼론 구조 또는 "로제타 스톤" 도메인 융합의 검사와 함께, 계통발생학적 프로파일을 비교하는 것은 지정된 "포스트 호몰로지" 기술로, 이 방법에 필수적인 연산은 어떤 단백질이 어떤 것과 상동하는지를 결정한 후에 시작된다.이러한 기법의 많은 수가 데이비드 아이젠버그와 동료들에 의해 개발되었다. 계통학적 프로필 비교는 1999년 펠레그리니 등에 의해 도입되었다.[1]

방법

2000종 이상의 박테리아, 고세균, 그리고 진핵생물이 현재 완전한 DNA 게놈 배열로 표현되어 있다.전형적으로, 게놈의 유전자는 호몰로지에 기초하여 특정 단백질 패밀리에 할당될 수 있는 단백질을 암호화한다.주어진 단백질 패밀리의 경우, 각 게놈(원래, 2진수, 제제)에서의 존재 또는 부재는 1(현재) 또는 0(부재)으로 표현된다.이것에 의해, 단백질군의 계통 발생 분포를, 게놈 마다의 숫자를 가지는 긴 2치수로 나타낼 수 있어 이러한 2치 표현을 간단하게 비교하고, 상관 계통 발생 분포를 탐색할 수 있다.완전한 게놈의 수가 많기 때문에, 이러한 프로파일은 풍부한 정보를 얻을 수 있습니다.완전한 게놈만을 사용하는 것의 장점은 특성이 없음을 나타내는 0 값이 신뢰할 수 있는 경향이 있다는 것입니다.

이론.

밀접하게 관련된 종들은 매우 유사한 유전자 세트를 가지고 있을 것으로 예상되어야 한다.하지만, 수평 유전자 이동과 유전자 손실을 포함하는 과정들에 의해 더 멀리 떨어진 종들 사이에 변화가 축적된다.개별 단백질은 단일 효소 반응을 실시하거나 보다 큰 단백질 복합체의 서브유닛으로 기능하는 등의 특정 분자기능을 가진다.광합성, 메타노제네시스 또는 히스티딘 생합성과 같은 생물학적 과정은 많은 단백질의 일치된 작용을 필요로 할 수 있다.만약 어떤 과정에 중요한 단백질이 손실된다면, 그 과정에 바쳐진 다른 단백질들은 쓸모 없게 될 것이다; 자연 선택은 이러한 쓸모없는 단백질이 진화적인 시간에 걸쳐 유지되는 것을 어렵게 만든다.따라서, 두 개의 다른 단백질 패밀리가 일관되게 함께 존재하거나 없는 경향이 있다면, 두 단백질이 어떤 생물학적 과정에서 협력한다는 가설이 유력하다.

진전과 과제

계통학적 프로파일링은 이전에는 알려지지 않았던 대사 경로의 효소, 보존된 조절 부위에 결합하는 전사 인자, 그리고 인간 [2]질병에서의 특정 돌연변이의 역할에 대한 설명을 포함한 생물학에서 수많은 발견을 이끌어냈다.방법 자체가 여러 가지 한계에 직면하기 때문에 방법 자체를 개선하는 것은 과학 연구의 활발한 영역이다.첫째, 두 단백질 패밀리의 공존은 종종 보존된 기능적 관계보다는 두 종의 최근 공통 조상을 나타낸다. 이 두 상관관계를 명확히 하기 위해서는 개선된 통계 방법이 필요할 수 있다.둘째, 호몰로그로 그룹화된 단백질은 기능이 다를 수 있고, 기능적으로 보존된 단백질은 호몰로그로 등록되지 않을 수 있다. 기능적 보존을 반영하기 위해 각 단백질군의 크기를 조정하는 개선된 방법은 개선된 결과로 이어질 것이다.

도구들

도구에는 PLEX(Protein Link Explorer)[3]가 있습니다.(현재는 사라짐) JGI IMG(통합 미생물 게놈)Phylogenetic Profiler(단일 유전자와 유전자 [4]카세트용).

메모들

  1. ^ Pellegrini M, Marcotte EM, Thompson MJ, Eisenberg D, Yeates TO.Proc Natl Acad Sci U S. A. 1999년 4월 13일;96(8):4285-8.
  2. ^ Kensche PR, van Noort V, Dutilh BE, Huynen MA. JR Soc 인터페이스.2008년 2월 6일;5(19): 151-70.
  3. ^ Date, Shailesh V.; Marcotte, Edward M. (2005-05-15). "Protein function prediction using the Protein Link EXplorer (PLEX)". Bioinformatics. 21 (10): 2558–2559. doi:10.1093/bioinformatics/bti313. ISSN 1367-4803. PMID 15701682.
  4. ^ Chen, I.-Min A.; Chu, Ken; Palaniappan, Krishna; Pillay, Manoj; Ratner, Anna; Huang, Jinghua; Huntemann, Marcel; Varghese, Neha; White, James R. (2018-10-05). "IMG/M v.5.0: an integrated data management and comparative analysis system for microbial genomes and microbiomes". Nucleic Acids Research. 47 (D1): D666–D677. doi:10.1093/nar/gky901. ISSN 1362-4962. PMC 6323987. PMID 30289528.