RNA결합단백질 데이터베이스
RNA-binding protein databaseRNA 결합 단백질 데이터베이스(RBPDB)는 RNA 결합 부위의 실험적 관찰을 포함하는 RNA 결합 단백질 특이성의 생물학적 데이터베이스이다.포함된 실험 결과는 1차 [1]문헌의 시험관내 및 생체내이다.호모사피엔스, 무스쿠루스, 드로소필라 멜라노가스터, 케노하브디티스 엘레강스 등 메타조아 4종을 포함하고 있다.이 데이터베이스에 포함된 RNA 결합 도메인은 RNA 인식 모티브, K 호몰로지, CCCH 아연 핑거 및 더 많은 도메인입니다.2021년 현재[update] 최신 RBPDB 릴리스(v1.3, 2012년 9월)에는 1,171개의 RNA 결합 [2]단백질이 포함되어 있다.
RNA 결합 단백질에 대한 배경 정보
전사와 번역 과정은 원핵생물과 진핵생물은 다르다.원핵생물과 달리, 이 두 과정은 진핵생물의 핵과 세포질에서 따로 일어난다.이 때문에 진핵생물은 mRNA 전처리를 위해 스플라이싱, 편집, 폴리아데닐화를 포함한 전사 후 수정이라는 전략을 적용한다.이 과정에서 RNA결합단백질(RBPs)은 중요한 역할을 한다.RNA에 결합할 수 있는 모든 RBP는 다른 특이성과 [3][4][5]친화성에 따라 달라집니다.RBP는 적어도 하나의 RNA 결합 도메인을 포함하며 일반적으로 여러 개의 결합 도메인을 가집니다.RNA결합 도메인(RBD, RNP 도메인 및 RNA 인식 모티브, RRM), K-호몰로지(KH) 도메인(타입 I 및 타입 II), RGG(Arg-Gly-Gly) 박스, Sm 도메인, 주로 DEAD/DEAH 박스, 핑거(Z-NFinger-X)([6][7]PAZ) 도메인은 충분한 특성을 가지고 있습니다.
RBP는 여러 바인딩 도메인에 의해 구축됩니다.이러한 도메인에는 기본적인 모듈러 유닛이 몇 개 포함되어 있습니다.하나의 모티브와 비교하여 RBP는 이러한 여러 모티브로 훨씬 더 긴 핵산을 인식할 수 있습니다.한편, RBP는 약한 상호작용을 형성함으로써 RNA에 결합한다.약한 상호작용 표면은 이러한 모티브에 의해 크게 증가한다.그 결과, RBP는 단일 [8]도메인보다 높은 특이성과 친화성으로 RNA를 결합할 수 있다.RNA 결합 단백질 데이터베이스에는 세 가지 주요 범주가 있습니다.RNA 인식 모티브(RRM), K-Homology 도메인(KH 도메인) 및 아연 핑거입니다.
관련 조사
RNA결합단백질도메인
Lunde의 기사에서, 그들의 그룹은 다양한 종류의 RNA 결합 단백질 모티브와 그들의 특정한 [7]기능을 도입했다.
RNA인식로티프(RRM)
RNA 인식 로티프(RRM)는 두 개의 나선형(βαβββ 위상)과 함께 네 가닥 반병렬 β-시트를 형성하는 약 80-90개의 아미노산을 포함한다.β-시트는 RNA 인식에 중요한 역할을 합니다.일반적으로 β-시트에 보존된 3개의 잔류물은 이 인식 과정에 매우 중요하다.구체적으로는 Arg 또는 Lys 잔기가 포스포디에스테르 골격에 소금 브릿지를 형성하고, 또 다른 2개의 방향족 잔기가 핵염기와 적층 상호작용을 한다.이들 4개의 β-시트 각각은 하나의 뉴클레오티드를 인식한다.그러나 노출된 루프와 추가적인 2차 구조를 통해 RRM은 최대 8개의 [7][9]뉴클레오티드를 인식할 수 있다.
K-호몰로지 도메인(KH 도메인)
K-호몰로지 도메인(KH 도메인)은 인간에서 최초로 식별되었다.이종핵리보핵단백질(hnRNP) K에서 유래한다.따라서 이 패밀리에 속하는 바인딩 도메인을 K-Homology 도메인이라고 합니다.이것은 ssDNA와 ssRNA 모두에 바인드되는 도메인입니다.진핵생물, 유박테리아, 고세균은 보통 이런 종류의 도메인을 가지고 있다.도메인에는 약 70개의 아미노산이 포함되어 있습니다.이 도메인의 중요한 시그니처 시퀀스는 (I/L/V)입니다.IGXXGX(I/L/V)모든 KH 도메인은 3가닥 β-시트와 3개의 α-헬리스를 포함한다.이 도메인에는 2개의 서브패밀리가 있습니다.유형 I KH 도메인(βαββα 위상) 및 유형 II KH 도메인(αββαβ 위상).두 클래스 모두에서 GXG 루프, 측면 나선, β-스트랜드 및 β2와 β3(타입 I) 사이 또는 α2와 β2(타입 II) 사이의 가변 루프가 RNA [7][10]인식에 매우 중요한 역할을 한다.
아연 손가락
아연 핑거는 아연배위잔기를 포함하는 도메인이다.이 도메인에는 Cys2His2(CCH), CCCH 또는 CCHC의 3가지 주요 유형이 있습니다.일반적으로 단백질에서 이 영역의 여러 번 반복 작용합니다.CCH 아연 핑거가 DNA에 결합할 때, 인식 α-나선의 잔류물이 주요 홈의 왓슨-크릭 염기쌍에 수소 결합을 형성한다.그것이 RNA에 결합할 때, DNA를 인식하는 데 사용되는 것과 동일한 잔류물이 RNA를 인식하는 데 사용될 수 있습니다.이 두 가지 유형의 뉴클레오티드를 구별하기 위해 아연 수치가 사용하는 전략은 이 도메인의 뚜렷한 구조적 배열을 포함할 수 있다.CCCH 및 CCHC 아연 핑거는 AU가 풍부한 RNA 원소에 결합한다.CCHH 아연 수치와는 달리 단백질의 모양은 [7][11]특이성의 주요 결정 요인이다.
RNA결합단백질 배열 선호도
Ray와 Kazan의 논문에서 그들은 RBP의 시퀀스 선호도에 대한 질문을 다룬다.그들의 연구에서, 하나의 단일 RBP는 복잡한 RNA 풀의 방대한 몰 초과로 배양된다.단백질은 친화력 선택을 통해 회수되고 관련 RNA는 마이크로 어레이 및 계산 분석을 통해 조사됩니다.그들의 결과는 RNA 결합 단백질이 배열 선호도를 가지며 동일하거나 밀접하게 관련된 RBP가 특정 유사한 RNA [12]배열에 결합할 것임을 보여준다.
사용하다
현재 RNA결합단백질 데이터베이스(RBPDB)에는 호모사피엔스, 무스칼루스, 드로필라 멜라노가스터, 케노하브디티스의 RNA결합단백질 1171개가 저장돼 있다.단백질은 영역이나 종별로 검색될 수 있다.두 방법 모두 유전자 기호, 주석 ID, 동의어, 유전자 기술, 종, RNA 결합 도메인, 실험 횟수 및 호몰로그를 포함하는 단백질의 상세 정보 목록으로 이어진다.실험 횟수에 대한 연결은 단백질과 관련된 연구 논문으로 이어진다.또한 이 데이터베이스에서 사용자는 특정 RNA 결합 배열과 관련된 실험을 검색할 수 있습니다.또한 이 사이트는 사용자가 시퀀스의 바인딩 사이트를 예측하는 데 도움이 됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ Cook, Kate B.; Kazan, Hilal (2010). "RBPDB: a database of RNA-binding specificities". Nucleic Acids Research. Oxford University Press. 39 (Database issue): D301–D308. doi:10.1093/nar/gkq1069. PMC 3013675. PMID 21036867.
- ^ "RBPDB: The database of RNA-binding specificities". rbpdb.ccbr.utoronto.ca. Retrieved 29 April 2021.
- ^ Matera, A. Gregory; Terns, Rebecca M.; Terns, Michael P. (March 2007). "Non-coding RNAs: lessons from the small nuclear and small nucleolar RNAs". Nature Reviews Molecular Cell Biology. Nature Publishing Group. 8 (3): 209–220. doi:10.1038/nrm2124. PMID 17318225. S2CID 30268055.
- ^ Glisovic, Tina; Bachorik, Jennifer L. (2008). "RNA-binding proteins and post-transcriptional gene regulation". FEBS Letters. Elsevier B.V. 582 (14): 1977–1986. doi:10.1016/j.febslet.2008.03.004. PMC 2858862. PMID 18342629.
- ^ Kishore, Shivendra; Luber, Sandra; Zavolan, Mihaela (2010). "Deciphering the role of RNA-binding proteins in the post-transcriptional control of gene expression". Briefings in Functional Genomics. 9 (5–6): 391–404. doi:10.1093/bfgp/elq028. PMC 3080770. PMID 21127008.
- ^ Chen, Y.; Varani, G. (2005). "Protein families and RNA recognition". FEBS J. 272 (9): 2088–2097. doi:10.1111/j.1742-4658.2005.04650.x. PMID 15853794. S2CID 12432954.
- ^ a b c d e Lunde, B.M.; Moore, C.; Varani, G. (2007). "RNA-binding proteins: modular design for efficient function". Nat. Rev. Mol. Cell Biol. 8 (6): 479–490. doi:10.1038/nrm2178. PMC 5507177. PMID 17473849.
- ^ Hogan, DJ; Riordan, DP (2008). "Diverse RNA-binding proteins interact with functionally related sets of RNAs, suggesting an extensive regulatory system". PLOS Biology. PLoS Biology. 6 (10): 2297–2313. doi:10.1371/journal.pbio.0060255. PMC 2573929. PMID 18959479.
- ^ Swanson MS, Dreyfuss G, Pinol-Roma S (1988). "Heterogeneous nuclear ribonucleoprotein particles and the pathway of mRNA formation". Trends Biochem. Sci. 13 (3): 86–91. doi:10.1016/0968-0004(88)90046-1. PMID 3072706.
- ^ García-Mayoral MF, Hollingworth D, Masino L, et al. (April 2007). "The structure of the C-terminal KH domains of KSRP reveals a noncanonical motif important for mRNA degradation" (PDF). Structure. 15 (4): 485–98. doi:10.1016/j.str.2007.03.006. PMID 17437720.
- ^ Klug A, Rhodes D (1987). "Zinc fingers: a novel protein fold for nucleic acid recognition". Cold Spring Harb. Symp. Quant. Biol. 52: 473–82. doi:10.1101/sqb.1987.052.01.054. PMID 3135979.
- ^ Ray, D.; Kazan, H. (2013). "A compendiumof RNA-binding motifs for decoding gene regulation". Nature. 499 (7457): 172–177. Bibcode:2013Natur.499..172R. doi:10.1038/nature12311. PMC 3929597. PMID 23846655.
외부 링크
- RBPDB 데이터베이스: RNA 결합 단백질 데이터베이스.
- 새로운 자원은 많은 단백질의 RNA 결합 부위를 카탈로그로 만듭니다.새로운 온라인 데이터베이스는 이끼에서 원숭이까지 289종 8,000개 이상의 단백질로 구성된 RNA 결합 사이트를 나열하고 있다.
