알 수 없는 함수의 도메인

Domain of unknown function

DUF(Domain of Unknown Function)는 특성화된 기능이 없는 단백질 도메인입니다.이들 패밀리는 프리픽스 DUF에 이은 번호를 사용하여 Pfam 데이터베이스에 수집되었습니다.예를 들어 DUF2992DUF1220입니다.2019년 현재, Pfam 데이터베이스에는 알려진 가족의 22% 이상을 나타내는 거의 4,000개의 DUF 가족이 있다.일부 DUF는 일반적으로 사용되고 있기 때문에 명명법을 사용하여 명명되지 않지만 그래도 DUF입니다.[1]

DUF 지정은 잠정적이며, 이러한 패밀리는 함수가 [2][3]식별된 후 보다 구체적인 이름으로 이름이 바뀌는(또는 기존 도메인으로 병합되는) 경향이 있습니다.

역사

DUF 명명 방식은 크리스 폰팅에 의해 SMART 데이터베이스[4]DUF1 및 DUF2를 추가하여 도입되었습니다.이 두 도메인은 세균 시그널링 단백질에 광범위하게 분포하는 것으로 밝혀졌다.그 후, 이러한 도메인의 기능이 식별되어 [2]각각 GGDEF 도메인과 EAL 도메인으로 이름이 변경되었습니다.

캐릭터라이제

구조 유전체 프로그램은 구조 결정을 통해 DUF의 기능을 이해하려고 시도했다.250개 이상의 DUF 가족의 구조가 해결되었습니다.이(2009) 연구는 약 3분의 2의 DUF 패밀리가 이전에 해결된 것과 유사한 구조를 가지고 있으며, 따라서 기존 단백질 슈퍼 패밀리의 발산 멤버일 가능성이 있는 반면, 약 3분의 1은 새로운 단백질 [5]폴드를 가지고 있음을 보여주었다.

일부 DUF 패밀리는 기능이 특징화된 도메인과 원격 시퀀스 호몰로지를 공유합니다.계산 작업을 사용하여 이러한 관계를 연결할 수 있습니다.2015년 연구에서는 DUF의 20%를 특성화된 구조 슈퍼패밀리에 [6]할당할 수 있었다.또한 Pfam은 "clan" 슈퍼 패밀리 항목에서 [1](수동으로 검증된) 할당을 지속적으로 수행합니다.

빈도와 보존

단백질 도메인과 DUF는 다른 생명 영역에 있습니다.왼쪽: 주석이 달린 도메인.오른쪽: 알 수 없는 기능의 도메인입니다.모든 중복이 [7]표시되는 것은 아닙니다.

2013년에는 전체 단백질 도메인의 20% 이상이 DUF로 주석 처리되었다.진핵생물에서는 1,500개가 조금 넘는 것에 비해 약 2,700개의 DUF가 박테리아에서 발견됩니다.800개 이상의 DUF가 박테리아와 진핵생물 사이에 공유되며, 이들 중 약 300개가 고기에 존재한다.총 2,786개의 박테리아 Pfam 도메인이 320개의 [7]DUF를 포함하여 동물에서 발생한다.

생물학에서의 역할

많은 DUF들이 보존이 잘 되어 있어 생물학에서 중요한 역할을 하고 있음을 보여준다.그러나 그러한 많은 DUF는 필수적이지 않기 때문에 생물학적 역할은 알려지지 않은 채로 남아 있는 경우가 많다.예를 들어 DUF143은 대부분의 박테리아와 진핵생물 [8]게놈에 존재한다.그러나 대장균에서 제거되었을 때 뚜렷한 표현형은 검출되지 않았다.나중에 DUF143을 포함하는 단백질은 두 개의 리보솜 서브유닛의 [8]집합을 차단하는 리보솜 소음인자임이 밝혀졌다.이 기능은 필수적인 것은 아니지만, 단백질 생합성을 차단함으로써 세포가 낮은 영양소 조건에 적응하도록 돕는다.결과적으로, 이러한 단백질과 DUF는 세포가 [8]굶주릴 때만 관련이 있다.따라서 많은 DUF(또는 알려지지 않은 기능의 단백질, PUF)가 특정 조건에서만 필요한 것으로 여겨진다.

필수 DUF

Goodacre 등은 355개의 필수 단백질(16개 모델 박테리아 종)에서 238개의 DUF를 확인했으며, 이들 대부분은 단일 도메인 단백질을 나타내며 DUF의 생물학적 필수성을 명확히 확립했다.이러한 DUF를 「필수 DUF」또는 「eDUF」[7]라고 부릅니다.

외부 링크

레퍼런스

  1. ^ a b El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC, Qureshi M, Richardson LJ, Salazar GA, Smart A, Sonnhammer EL, Hirsh L, Paladin L, Piovesan D, Tosatto SC, Finn RD (January 2019). "The Pfam protein families database in 2019". Nucleic Acids Research. 47 (D1): D427–D432. doi:10.1093/nar/gky995. PMC 6324024. PMID 30357350.
  2. ^ a b Bateman A, Coggill P, Finn RD (October 2010). "DUFs: families in search of function". Acta Crystallographica. Section F, Structural Biology and Crystallization Communications. 66 (Pt 10): 1148–52. doi:10.1107/S1744309110001685. PMC 2954198. PMID 20944204.
  3. ^ Punta M, Coggill PC, Eberhardt RY, Mistry J, Tate J, Boursnell C, Pang N, Forslund K, Ceric G, Clements J, Heger A, Holm L, Sonnhammer EL, Eddy SR, Bateman A, Finn RD (January 2012). "The Pfam protein families database". Nucleic Acids Research. 40 (Database issue): D290-301. doi:10.1093/nar/gkr1065. PMC 3245129. PMID 22127870.
  4. ^ Schultz J, Milpetz F, Bork P, Ponting CP (May 1998). "SMART, a simple modular architecture research tool: identification of signaling domains". Proceedings of the National Academy of Sciences of the United States of America. 95 (11): 5857–64. Bibcode:1998PNAS...95.5857S. doi:10.1073/pnas.95.11.5857. PMC 34487. PMID 9600884.
  5. ^ Jaroszewski L, Li Z, Krishna SS, Bakolitsa C, Wooley J, Deacon AM, Wilson IA, Godzik A (September 2009). "Exploration of uncharted regions of the protein universe". PLOS Biology. 7 (9): e1000205. doi:10.1371/journal.pbio.1000205. PMC 2744874. PMID 19787035.
  6. ^ Mudgal R, Sandhya S, Chandra N, Srinivasan N (July 2015). "De-DUFing the DUFs: Deciphering distant evolutionary relationships of Domains of Unknown Function using sensitive homology detection methods". Biology Direct. 10 (1): 38. doi:10.1186/s13062-015-0069-2. PMC 4520260. PMID 26228684.
  7. ^ a b c Goodacre NF, Gerloff DL, Uetz P (December 2013). "Protein domains of unknown function are essential in bacteria". mBio. 5 (1): e00744-13. doi:10.1128/mBio.00744-13. PMC 3884060. PMID 24381303.
  8. ^ a b c Häuser R, Pech M, Kijek J, Yamamoto H, Titz B, Naeve F, Tovchigrechko A, Yamamoto K, Szaflarski W, Takeuchi N, Stellberger T, Diefenbacher ME, Nierhaus KH, Uetz P (2012). Hughes D (ed.). "RsfA (YbeB) proteins are conserved ribosomal silencing factors". PLOS Genetics. 8 (7): e1002815. doi:10.1371/journal.pgen.1002815. PMC 3400551. PMID 22829778.