보존된 비코딩 시퀀스

Conserved non-coding sequence

보존된 비코딩 시퀀스(CNS)는 진화적으로 보존비코딩 DNADNA 시퀀스다.이 시퀀스는 유전자 생산을 조절할 수 있는 잠재력에 관심이 있다.[1]

식물과[2] 동물의[1] CNS는 전사 인자 결합 사이트 및 기타 CIS 작용 규제 요소와 높은 연관성을 가진다.보존된 비코딩 시퀀스는 이러한 지역에서 돌연변이가 보존된 유전자의 규제를 변화시켜 종별 특정한 유전자 발현 패턴을 만들 수 있기 때문에 진화적으로 분화하는[3] 중요한 장소가 될 수 있다.이러한 특징들은 그들을 비교 유전체학에서 귀중한 자원으로 만들었다.

원천

모든 CNS는 진화에 제약을 받기 위해 어느 정도 기능을 수행할 가능성이 있지만, 게놈에서 어디서 발견되고 어떻게 도달했는지에 따라 구별할 수 있다.

인트론스

인트론은 대부분 유전자의 부호화를 방해하는 진핵생물에서 발견되는 일련의 배열로 염기 길이는 3개의 크기 순서에 따라 다양하다.인트론 시퀀스는 종종 그들의 진화에 기능적 제약을 가하는 표현 조절 요소를 포함하기 때문에 보존될 수 있다.[4]서로 다른 왕국의 종들 사이의 보존된 인트론 패턴은 진화 역사에서 서로 다른 지점들에서 인트론 밀도에 대해 추론하기 위해 사용되어 왔다.이는 진핵생물(1,28)에서 인트론 손익의 역학을 이해하는 데 중요한 자원이 된다.[4][5]

미통보 지역

가장 보존도가 높은 비코딩 영역 중 일부는 인트론이 아닌 성숙한 RNA 대본의 3번째 끝에 있는 비번역 영역(UTR)에서 발견된다.이것은 중요한 기능인 변환 후 수준에서 작동한다는 것을 시사한다.이러한 지역이 중요한 규제 기능을 수행하는 경우, 진화 시간에 걸쳐 3'-UTR 길이가 증가하면 보존된 UTR이 유기체의 복잡성에 기여한다는 것을 알 수 있다.동일한 대사 계열에 속하는 유전자에 보존되는 UTR의 규제 모티브는 잠재적으로 RNA 대본을 대상으로 하는 매우 구체적인 의약품 개발에 사용될 수 있다.[4]

전이성 원소

반복적인 원소는 몇 가지 다른 전이 과정의 결과로 유기체의 게놈에 축적될 수 있다.진화하는 동안 이런 일이 일어난 정도는 크게 다르다. 반복적인 DNA가 플라이 게놈의 3%에 불과하지만 인간 게놈의 50%를 차지한다.[4]

전이 가능한 원소의 보존을 설명하는 이론은 다양하다.하나는 유사 유전자처럼, 그것들은 환경 변화에 더 빨리 적응할 수 있도록 새로운 유전 물질의 원천을 제공한다는 것이다.보다 간단한 대안은 진핵 게놈은 전이성 원소의 확산을 막을 수단이 없을 수 있기 때문에, 그것들이 유전자에 삽입되거나 가까이 가지 않는 한, 그들이 본질적인 기능을 방해할 수 있는 방식으로 자유롭게 축적될 수 있다는 것이다.[6]최근의 한 연구는 트랜스포존이 에우테리아 특유의 CNS의 최소 16%를 기여한다는 것을 보여주었고, 그것들을 포유류에서 유전자 조절의 진화에 있어 "주요 창조력"으로 표시했다.[7]전이 가능한 원소에는 크게 세 가지 등급이 있는데, 이는 그들이 증식하는 메커니즘에 의해 구별된다.[6]

DNA 트랜스포존은 전이효소 단백질을 암호화하는데, 이것은 역반복된 반복 순서에 의해 측면에 있다.전이효소는 염기서열을 분해하고 게놈의 다른 곳에서 다시 분해한다.DNA 복제 직후에 배설하고 아직 복제되지 않은 대상 사이트에 삽입함으로써 게놈의 트랜스폰 수가 증가할 수 있다.[6]

역트랜스포저는 역스크립트랜스포저를 사용하여 TE 대본에서 cDNA를 생성한다.이것들은 또한 긴 터미널 반복 (LTR) 역트랜스포존, 긴 간격의 핵 요소 (LINE), 그리고 짧은 간격의 핵 요소 (SINE)로 나뉜다.LTR 역트랜스포존스에서는 RNA 템플릿이 분해된 후 역트랜스 cDNA를 보완하는 DNA 가닥이 원소를 이중 가닥 상태로 되돌린다.통합효소, LTR 역트랜스포존에 의해 인코딩된 효소, 그리고 나서 새로운 대상 부지에 원소를 재조합한다.이 요소들은 전환 과정을 중재하는 긴 단자 반복(300–500bp)에 의해 측면에 배치된다.[6]

LINE은 LINE 인코딩된 내분비선에 의한 분할 후 대상 사이트에서 cDNA를 합성하는 더 간단한 방법을 사용한다.LINE 인코딩 리버스 transcriptase는 시퀀스별로 구분되지 않는다.관련 없는 RNA 대본의 LINE 기계에 의한 결합은 비기능 처리된 유사 생물을 발생시킨다.유전자의 전사 부분에 작은 유전자의 촉진자가 포함되면 안정적인 대본을 복제해 게놈에 여러 번 재삽입할 수 있다.이 과정에서 생성된 원소를 SINE이라고 한다.[6]

보존된 규제 전이 가능한 요소

보존된 규제 전이 가능 요소가 게놈에서 활성화되면 새로운 촉진 지역을 도입하거나 기존 규제 사이트를 교란하거나, 복사된 영역에 삽입할 경우 스플리싱 패턴을 변경할 수 있다.특정 전치요소는 그것이 생성하는 표현식이 적응적 장점을 방해하는 경우에 대해 긍정적으로 선택될 것이다.이것은 인간에게서 발견된 보존 지역들 중 일부를 만들어냈다.인간에게 있어서 거의 25%의 특색있는 프로모터들이 전치된 요소들을 포함하고 있다.[8]이것은 특히 인간의 대부분의 전이 가능한 원소가 더 이상 활동하지 않는다는 사실에 비추어 볼 때 흥미롭다.[6]

유사생식

유사유전자는 시퀀스 삭제, 삽입 또는 돌연변이에 의해 비활성화된 한때 기능했던 유전자의 잔재물이다.이 프로세스의 주요 증거는 다른 관련 게놈에서 이러한 비활성화된 시퀀스에 대해 완전히 작동하는 직교법의 존재 여부다.[4]유전자 복제다형화 사건 이후 유사생물이 흔히 나타난다.유전자의 기능적 복사본이 두 개 있으면 둘 다의 표현성을 유지해야 한다는 선택적 압력이 없어 한 개라도 자유롭게 변이를 비기능적 유사유전자로 축적할 수 있다.이것은 전형적인 경우로, 중립적 선택을 통해 유사 유전자가 새로운 유전 물질의 "저수지" 역할을 하면서 돌연변이를 축적할 수 있고, 게놈에 재조합될 가능성이 있다.그러나 일부 유사생물은 포유류에서 보존되고 있는 것으로 밝혀졌다.[9]이에 대한 가장 간단한 설명은 이러한 부호화되지 않은 지역이 어느 정도 생물학적 기능을 제공할 수 있다는 것이며, 이는 여러 보존된 유사 생물의 경우인 것으로 밝혀졌다.예를 들어, Makorin1 mRNA는 여러 생쥐 종에 보존되어 있는 파라로그 유사 동종인 Makorin1-p1에 의해 안정화된 것으로 밝혀졌다.또한 인간과 쥐, 인간과 침팬지 사이에 보존되는 다른 유사유전자도 발견되었는데, 이는 종의 분화에 앞서 일어난 복제 사건에서 비롯된다.이들 유사체 전사의 증거도 생물학적 함수를 가지고 있다는 가설을 뒷받침한다.[10]잠재적으로 기능할 수 있는 유사 생물의 발견은 이 용어가 원래 생물학적 기능이 없는 퇴화된 시퀀스를 의미했기 때문에 그것들을 정의하는 데 어려움을 야기한다.[11]

가성종의 예로는 대부분의 조류와 포유류에서 L-아스코르브산(비타민C)의 생합성에 필요한 간 효소인 L-굴로놀락톤 산화효소의 유전자가 있으나, 아스코르브산이나 아스코르베이트를 식품으로부터 필요로 하는 인간을 포함한 영장류의 하플로리니 하위순서에서 돌연변이를 일으킨다.많은 돌연변이를 가진 이 비기능적 유전자의 잔해는 기니피그와 인간의 게놈에 여전히 존재한다.[12]

극지방

UCR(Ultraconserved Region, UCR)은 종 전체에서 100% 정체성을 가진 길이 200bp 이상의 지역이다.이러한 고유한 시퀀스는 대부분 부호화되지 않은 영역에서 발견된다.이들 지역에 대한 음의 선택적 압력이 단백질 코딩 지역의 선택보다 훨씬 강한 이유는 아직도 충분히 이해되지 않고 있다.[13][14]이들 지역이 독특하다고 볼 수 있지만, 시퀀스 보존도가 높은 지역과 시퀀스 보존이 완벽한 지역 간의 구분이 반드시 생물학적 의의의 중 하나만은 아니다.사이언스지의 한 연구는 보존이 완벽한지 여부에 관계없이 모든 극도로 보존된 비코딩 시퀀스는 중요한 규제 기능을 가지고 있다는 것을 발견했는데, 이는 초인종 보존의 구별을 다소 자의적으로 보이게 한다.[14]

비교유전체학에서

비록 시스 규제 요소의 보존이 특히 유용한 것으로 증명되었지만, 기능적 및 비기능적 부호화 영역의 보존은 비교 유전체학을 위한 중요한 도구를 제공한다.[4]CNS의 존재는 일부 경우에 분산 시간의 부족에 기인할 수 있지만,[15] 더 일반적인 생각은 CNS가 진화에 다양한 정도의 제약을 두는 기능을 수행한다는 것이다.이 이론과 일관되게, 시스 규제 요소는 보존된 부호화되지 않은 지역에서 흔히 발견된다.따라서, 시퀀스 유사성은 종에 걸쳐 보존된 규제 요소를 식별하려고 할 때 검색 공간을 제한하는 매개변수로 종종 사용된다. 단, 이것은 멀리 떨어진 관련 유기체를 분석하는 데 가장 유용하지만, 더 가까운 친척들이 비기능 요소들 사이에서 시퀀스 보존을 하기 때문이다.[4][16][17]

시퀀스 유사성이 높은 직교법은 동일한 규제 요소를 공유하지 않을 수 있다.[18]이러한 차이점들은 종마다 다른 표현 패턴을 설명할 수 있다.[19]비코딩 시퀀스의 보존은 단일 종 내 파라로그 분석에도 중요하다.Paralogic clusters of Hox 유전자에 의해 공유되는 CNS는 발현 조절 부위의 후보로서, 아마도 이러한 유전자의 유사한 발현 패턴을 조정할 수 있을 것이다.[16]

직교 유전자의 촉진자 영역에 대한 비교 유전학 연구는 촉진자 지역에서 전사 인자 결합 부위의 존재와 상대적 위치의 차이를 탐지할 수 있다.[20]시퀀스 유사성이 높은 직교법은 동일한 규제 요소를 공유하지 않을 수 있다.[18]이러한 차이점들은 종마다 다른 표현 패턴을 설명할 수 있다.[19]

보존된 부호화 지역과 일반적으로 관련된 규제 기능은 진핵 복잡성의 진화에 역할을 하는 것으로 생각된다.평균적으로, 식물은 포유류보다 유전자당 CNS를 적게 함유하고 있다.이것은 그들이 더 많은 폴리플로이드화, 즉 게놈 복제 사건을 겪은 것과 관련이 있는 것으로 생각된다.유전자 복제가 뒤따르는 하위 기능화 동안, 유전자당 CNS 손실률이 더 높을 가능성이 있다.따라서, 게놈 복제 사건은 식물들이 각각 더 적은 수의 CNS를 가진 더 많은 유전자를 가지고 있다는 사실을 설명할 수 있다.CNS의 수가 규제 복잡성의 대용물이라고 가정하면, 이는 식물과 포유류 사이의 복잡성의 차이를 설명할 수 있다.[21]

유전자 조절의 변화가 인간과 침팬지 사이의 차이점 대부분을 차지한다고 생각되기 때문에, 연구원들은 이것을 보여주기 위해 CNS를 연구해왔다.인간과 다른 영장류 사이의 CNS의 일부는 인간 특유의 단일 뉴클레오티드 다형질이 농축되어 있어 이러한 SNP에 대한 긍정적 선택과 CNS의 진화가 가속화되고 있음을 시사한다.이러한 SNP의 상당수는 유전자 발현상의 변화와도 연관되어, 이러한 CNS가 인간 진화에 중요한 역할을 했음을 시사한다.[22]

온라인 생물정보 소프트웨어

프로그램 웹사이트[4]
콘사이트 http://consite.genereg.net/
안코라 http://ancora.genereg.net/
풋프린터 http://bio.cs.washington.edu/software
게놈트라팩 http://genometrafac.cchmc.org/genome-trafac/index.jsp
rVISTA http://rvista.dcode.org/
투칸 http://homes.esat.kuleuven.be/~saerts/sauthors/php
트라팩 http://trafac.chmcc.org/trafac/index.jsp
UCNE베이스 http://ccg.vital-it.ch/UCNEbase/

참조

  1. ^ a b Hardison, RC. (Sep 2000). "Conserved noncoding sequences are reliable guides to regulatory elements". Trends Genet. 16 (9): 369–72. doi:10.1016/s0168-9525(00)02081-3. PMID 10973062. Archived from the original on 2000-12-04. Retrieved 2011-02-18.
  2. ^ Freeling, M; Subramaniam, S (Apr 2009). "Conserved noncoding sequences (CNSs) in higher plants". Curr Opin Plant Biol. 12 (2): 126–32. doi:10.1016/j.pbi.2009.01.005. PMID 19249238.
  3. ^ Prabhakar, S.; Noonan, JP.; Pääbo, S.; Rubin, EM. (Nov 2006). "Accelerated evolution of conserved noncoding sequences in humans". Science. 314 (5800): 786. doi:10.1126/science.1130738. PMID 17082449.
  4. ^ a b c d e f g h Jegga, AG.; Aronow, BJ. (Apr 2008). Evolutionarily Conserved Noncoding DNA. eLS. doi:10.1002/9780470015902.a0006126.pub2. ISBN 978-0470016176.
  5. ^ Rogozin, IB.; Wolf, YI.; Sorokin, AV.; Mirkin, BG.; Koonin, EV. (Sep 2003). "Remarkable Interkingdom Conservation of Intron Positions and Massive, Lineage-Specific Intron Loss and Gain in Eukaryotic Evolution". Current Biology. 13 (17): 1512–1517. doi:10.1016/S0960-9822(03)00558-X. PMID 12956953.
  6. ^ a b c d e f Eickbush, TH.; Eickbush, DJ. (July 2006). "Transposable Elements: Evolution". eLS.
  7. ^ Mikkelsen, T.S.; et al. (2007). "Genome of the marsupial Monodelphis domestica reveals innovation in non-coding sequences". Nature. 447 (7141): 167–177. doi:10.1038/nature05805. PMID 17495919.
  8. ^ Feschotte, Cédric (May 2008). "Transposable Elements and the Evolution of Regulatory Networks". Nature Reviews Genetics. 9 (5): 397–405. doi:10.1038/nrg2337. PMC 2596197. PMID 18368054.
  9. ^ 쿠퍼, DN, 인간 유전자 진화옥스퍼드: BIOS 사이언티픽 출판사, 1988년 9월, 페이지 265-292
  10. ^ Svensson, O.; Arvestad, L.; Lagergren, J. (May 2005). "Genome-wide survey for biologically functional pseudogenes". PLoS Comput. Biol. 2 (5): 46. doi:10.1371/journal.pcbi.0020046. PMC 1456316. PMID 16680195.
  11. ^ Podlaha, Ondrej.; Zhang, Jianzhi. (Nov 2010). "Pseudogenes and Their Evolution". eLS.
  12. ^ Nishikimi M, Kawai T, Yagi K (October 1992). "Guinea pigs possess a highly mutated gene for L-gulono-gamma-lactone oxidase, the key enzyme for L-ascorbic acid biosynthesis missing in this species". J. Biol. Chem. 267 (30): 21967–72. PMID 1400507.
  13. ^ Bejerano, G.; Pheasant, M.; Makunin, I.; Stephen, S.; Kent, W.J.; Mattick, J.S.; Haussler, David. (May 2004). "Ultraconserved Elements in the Human Genome". Science. 304 (5675): 1321–1325. CiteSeerX 10.1.1.380.9305. doi:10.1126/science.1098119. PMID 15131266.
  14. ^ a b Katzman, Sol.; Kern, A.D.; Bejerano, G.; Fewell, G.; Fulton, L.; Wilson, R.K.; Salama, S.R.; Haussler, David. (Aug 2007). "Human Genome Ultraconserved Elements are Ultraselected". Science. 317 (5840): 915. doi:10.1126/science.1142430. PMID 17702936.
  15. ^ Dubchack, I.; Brudno, M.; Loots, GG.; Pachter, L.; Mayor, C.; Rubin, EM.; Frazer, KA. (2000). "Active Conservation of Noncoding Sequences Revealed by Three-Way Species Comparisons". Genome Res. 10 (9): 1304–1306. doi:10.1101/gr.142200. PMC 310906. PMID 10984448.
  16. ^ a b Matsunami, M.; Sumiyama, K.; Saitou, N. (Sep 2010). "Evolution of Conserved Non-Coding Sequences Within the Vertebrate Hox Clusters Through the Two-Round Whole Genome Duplications Revealed by Phylogenetic Footprinting Analysis". Journal of Molecular Evolution. 71 (5–6): 427–463. doi:10.1007/s00239-010-9396-1. PMID 20981416.
  17. ^ Santini, S.; Boore, JL.; Meyer, A. (2003). "Evolutionary Conservation of Regulatory Elements in Vertebrate Hox Gene Clusters". Genome Res. 13 (6A): 1111–1122. doi:10.1101/gr.700503. PMC 403639. PMID 12799348.
  18. ^ a b Greaves, D.R.; et al. (1998). "Functional Comparison of the Murine Macrosialin and Human CD68 Promoters in Macrophage and Nonmacrophage Cell Lines". Genomics. 54 (1): 165–168. doi:10.1006/geno.1998.5546. PMID 9806844.
  19. ^ a b Marchese, A.; et al. (1994). "Mapping Studies of Two G Protein-Coupled Receptor Genes: An Amino Acid Difference May Confer a Functional Variation Between a Human and Rodent Receptor". Biochem Biophys Res Commun. 205 (3): 1952–1958. doi:10.1006/bbrc.1994.2899. PMID 7811287.
  20. ^ Margarit, Ester; et al. (1998). "Identification of Conserved Potentially Regulatory Sequences of the SRY Gene from 10 Different Species of Mammals". Biochem Biophys Res Commun. 245 (2): 370–377. doi:10.1006/bbrc.1998.8441. PMID 9571157.
  21. ^ Lockton, Steven.; Gaut, BS. (Jan 2005). "Plant conserved non-coding sequences and paralogue evolution". Trends in Genetics. 21 (1): 60–65. doi:10.1016/j.tig.2004.11.013. PMID 15680516.
  22. ^ Bird, Christine P.; et al. (2007). "Fast-evolving noncoding sequences in the human genome". Genome Biology. 8 (6): R118. doi:10.1186/gb-2007-8-6-r118. PMC 2394770. PMID 17578567.