C값

C-value

C-값피코그램에서 반수체핵(예를 들어 배우자) 내에 포함된 DNA의 양 또는 진핵생물 2배체 체세포의 절반이다.경우에 따라서는 (특히 이배체 유기체 사이에서) C-값과 게놈 크기라는 용어가 서로 교환하여 사용되기도 하지만, 다중배체에서는 C-값이 동일한 핵 내에 포함된 둘 이상의 게놈을 나타낼 수 있다.그레일허버 [1]는 이 문제를 명확히 하기 위해 몇 가지 새로운 용어 층과 관련 약어를 제안했지만, 이러한 다소 복잡한 추가 사항은 다른 저자에 의해 아직 사용되지 않고 있습니다.

용어의 기원

많은 저자들이 "C-value"의 "C"가 "특징", "내용" 또는 "완성"을 의미한다고 잘못 가정했습니다.심지어 이 용어의 기원을 추적하려는 작가들 사이에서도 휴슨 스위프트가 1950년에 [2]이 용어를 만들 때 명확하게 정의하지 않았기 때문에 약간의 혼란이 있었다.Swift는 원본 논문에서 DNA 함량의 "클래스" (예: Gregory 2001,[3] 2002[4])에 대해 "1C 값", "2C 값" 등의 명칭을 사용한 것으로 보이지만, Swift는 Professor에게 보낸 개인 서신에서 설명했습니다.마이클 D.1975년 베넷은 "C라는 글자가 '상수' 즉, 특정 유전자형의 특징인 DNA의 양보다 더 매력적인 것은 없을 것 같다"고 말했다(베넷과 리치[5] 2005에서 인용).이는 1948년 벤들리와 벤들리가 "특정 동물 종에 속하는 모든 개체의 핵 DNA 함량이 현저하게 일정하다"고 발표한 보고서와 관련이 있다([6]원문 프랑스어 번역).스위프트의 이 주제에 대한 연구는 특히 개인 내 다른 세포 유형의 염색체 세트 간의 변화(또는 그 결여)와 관련이 있지만, 그의 표기법은 개별 종의 반수체 DNA 함량에 대한 "C-값"으로 발전하여 오늘날에도 이 용법을 유지하고 있다.

종간의 변화

C 값은 종마다 매우 다르다.동물에서는 3,300배 이상, 육상 식물에서는 약 1,[5][7]000배 정도 차이가 납니다.원생생물 게놈은 크기가 30만 배 이상 차이가 나는 것으로 보고됐지만 이 범위의 최고 수준(아메바)에 의문이 제기돼 왔다.C-값의 변화는 유기체의 복잡성이나 게놈에 포함된 유전자의 수와는 관련이 없다. 예를 들어, 일부 단세포 원생체들인간보다 훨씬 더 큰 게놈을 가지고 있다. 관찰은 코드화되지 않은 DNA가 발견되기 전에는 직관에 반하는 것으로 간주되었다.그것은 결과적으로 C-값 역설로 알려지게 되었다.그러나, C-값과 유전자 번호의 차이에 대한 역설적인 측면은 더 이상 없지만, 이 용어는 여전히 일반적으로 사용되고 있다.개념적 명확화의 이유로, 대신에 게놈 크기 변화에 관해 남아 있는 다양한 퍼즐들은 C-값 수수께끼로 알려진 복잡하지만 명확하게 정의된 퍼즐을 더 정확하게 구성하도록 제안되었다.C 값은 세포 크기, 세포 분열 속도 및 분류군에 따라 신체 크기, 대사율, 발달 속도, 장기 복잡성, 지리적 분포 또는 멸종 위험을 포함세포 및 생물 수준의 다양한 특징과 관련이 있다(최근 리뷰는 Bennett and Leitch 2005;[5] Gregory[7] 2005 참조).

C-값 수수께끼 또는 C-값 역설은 진핵 생물 종들 사이의 핵 게놈 크기의 광범위한 변화를 둘러싼 복잡한 퍼즐이다.C-값 수수께끼의 중심에는 게놈 크기가 유기체의 복잡성과 상관관계가 없다는 관찰이 있다. 예를 들어, 일부 단세포 원생생물들인간보다 훨씬 더 큰 게놈을 가지고 있다.

일부에서는 C-값 수수께끼라는 용어를 선호한다. 왜냐하면 C-값 수수께끼라는 용어는 게놈 크기 진화에 대한 완전한 이해를 얻으려면 답변이 필요한 모든 질문을 명시적으로 포함하기 때문이다(Gregory 2005).게다가, 역설이라는 용어는 진핵생물 게놈의 가장 기본적인 특징 중 하나에 대한 이해의 부족을 암시한다: 즉, 진핵생물 게놈이 주로 비암호화 DNA로 구성되어 있다는 것이다.어떤 사람들은 역설이라는 용어가 작가들로 하여금 실제로는 다면적인 [8]퍼즐에 대한 단순한 일차원적인 해결책을 찾도록 유도하는 불행한 경향을 가지고 있다고 주장해왔다.이러한 이유로 2003년 영국 [8] 왕립식물원에서 열린 제2차 식물 게놈 크기 토론회 및 워크숍에서 "C-value enigma"라는 용어를 선호하여 "C-value paradox"라는 용어가 승인되었고, 점점 더 많은 저자들이 이 용어를 채택하기 시작했다.

C값 역설

1948년, 로저와 콜레트 벤들리는 "특정 동물 [9]종에 속하는 모든 개체의 핵 DNA 함량에서 현저한 항상성"을 보고했는데, 그들은 단백질보다는 DNA가 유전자가 구성되는 물질이라는 을 증거로 삼았다.C-값이라는 용어는 이 관측된 항상성을 나타냅니다.하지만, 곧 C-값(유전자 크기)은 종마다 매우 다르며 이것은 추정된 유전자 수와는 아무런 관련이 없다는 것이 밝혀졌다(생물[10]복잡성에 의해 반영된다.예를 들어, 일부 도롱뇽세포는 인간의 [11]세포보다 40배나 더 많은 DNA를 가지고 있을 수 있다.유전자 정보가 DNA에 의해 암호화되어도 추정 유전자 번호와는 아무런 관계가 없기 때문에 C-값이 일정하다고 가정했을 때, 이것은 역설적인 것으로 간주되었다; C-값 역설이라는 용어는 C.A.에 의해 이 상황을 묘사하기 위해 사용되었다.1971년 토마스 주니어

1970년대 초 코드화되지 않은 DNA의 발견은 C-값 역설의 주요 의문을 해결했다: 진핵 생물의 DNA의 대부분이 코드화되지 않았기 때문에 유전자 크기가 진핵 생물의 유전자 번호를 반영하지 않는다.를 들어 인간 게놈은 2% 미만의 단백질 코딩 영역으로 구성되며, 나머지는 다양한 유형의 비코딩 DNA(특히 전이성 요소)[12]입니다.

C값 수수께끼

"C-값 수수께끼"라는 용어는 더 흔하지만 오래된 용어 "C-값 역설"(Thomas 1971)의 업데이트를 나타내며, 궁극적으로 반수체 핵 DNA 함량에 대한 용어 "C-값"(1950년 스위프트)에서 파생되었다. 용어는 캐나다 겔프 대학의 생물학자 T. 라이언 그레고리 박사가 2000/2001년에 만들었다.일반적으로 C값 수수께끼는 다른 진핵생물의 게놈에서 발견되는 비코드 DNA의 양 변화 문제와 관련이 있다.

C-값 수수께끼는 기존의 C-값 역설과 달리 다음과 같은 독립적이지만 동일하게 중요한 일련의 구성요소 질문으로 정의된다.

  • 다른 진핵생물 게놈에서는 어떤 종류의 비암호화 DNA가 발견되고 어떤 비율로 발견됩니까?
  • 이 비암호화 DNA는 어디에서 유래하고, 어떻게 시간이 지남에 따라 게놈에서 퍼지거나 손실되는가?
  • 이 코드화되지 않은 DNA는 염색체, , 세포, 그리고 유기체에 어떤 영향, 혹은 심지어 기능을 가지고 있을까?
  • 왜 어떤 종들은 놀라울 정도로 능률적인 염색체를 보이는가? 반면에 다른 종들은 엄청난 양의 비암호화 DNA를 가지고 있는가?

C-값 계산

표 1: 뉴클레오티드의 상대적 분자량 †
뉴클레오티드 화학식 상대 분자량(Da)
2가 디옥시아데노신5가 1인산 동작하지101456 않다 331.2213
2-디옥시티미딘5-디옥시티미딘1인산 동작하지101528 않다 322.2079
2-디옥시구아노신5-디옥시구아노신1인산 동작하지101457 않다 347.2207
2γ-디옥시시티딘5γ-일인산 동작하지91437 않다 307.1966

②표 출처:돌젤 외, 2003[13]

뉴클레오티드 쌍(또는 염기 쌍)의 수를 DNA의 피코그램으로 변환하는 공식은 다음과 같습니다.[13]

게놈 크기(bp) = (0.978 x 109) x DNA 함량(pg) = 게놈 크기(bp) / (0.978 x9 10) 1 pg = 978 Mbp

표 1의 데이터를 사용하여 A/T = 615.383 및 G/C = 616.3711과 같이 뉴클레오티드 쌍의 상대 질량을 계산할 수 있으며, 이는 하나의 포스포디에스테르 결합의 형성은 하나의2 HO 분자의 손실을 수반한다는 점에 유의한다.또, DNA사슬중의 뉴클레오티드의 인산염은 산성이기 때문에, 생리적 pH에서는 H이온이+ 해리된다.A/T 대 G/C 쌍의 비율이 1:1일 때(GC 함량이 50%) 1개의 뉴클레오티드 쌍의 평균 상대 질량은 615.8771이다.

상대 분자 질량은 절대값으로 변환될 수 있습니다. 이 값은 Picogram에서 원자 질량 단위(1u)를 곱한 값입니다.따라서 615.8771에 1.660539 × 10pg를−12 곱한다.따라서, 뉴클레오티드 쌍당 평균 질량은 1.023 × 10−9 pg가 될 것이며, DNA의 1 pg는 0.978 × 109 염기쌍(978 Mbp)[13]을 나타낼 것이다.

돌젤 연구진이 가정한 바와 같이 정확히 50%의 GC 함량(A/T 및 G/C 뉴클레오티드 염기의 등량)을 가진 종은 없다.단, G/C 쌍은 A/T 쌍보다 약 1/6 %만 무거우므로 GC 함량 변동 효과는 작다.실제 GC 함량은 종 간, 염색체 간, 그리고 등핵체 간(GC 함량이 유사한 염색체 단면)에 따라 다르다.GC 함량에 대한 Dolejel의 계산을 조정하면, 피코그램 당 염기쌍의 이론적 변화는 GC 함량이 100%일 경우 977.0317Mbp/pg에서 0% GC 함량이 978.6005Mbp/pg(A/T가 더 가볍고, Mbp/pg가 더 많음)이며, GC 함량이 9778.815Mbp/pg의 중간점이 50Pg이다.

인간 C값

인간[14] 게놈의 크기는 다양하지만, 현재 기준[15] 인간 게놈의 핵 반수체 크기는 X 생식체의 경우 3,031,042,417 bp, Y 생식체의 경우 2,932,228,937 bp이다.X 생식체와 Y 생식체는 모두 결합 길이가 양쪽 생식체에서 게놈의 대다수를 구성하는 22개의 오토솜을 포함합니다.X 생식체는 X 염색체를 포함하고 Y 생식체는 Y 염색체를 포함합니다.X염색체의 크기가 큰 것은 두 생식체의 크기 차이에 원인이 있다.배우자가 결합되었을 때 XX 암컷 접합자의 크기는 6,062,084,834 bp이고 XY 수컷 접합자의 크기는 5,963,271,354 bp입니다.단, XX암컷 접합자의 염기쌍은 각각 23개의 이종염색체의 2개의 상동군 사이에 분포하고, XY수컷 접합자의 염기쌍은 각각 22개의 이종염색체와 2개의 이종염색체의 2개의 상동군 사이에 분포한다.각각의 접합자는 46개의 염색체를 가지고 있지만 XX 암컷 접합자의 23개의 염색체는 이종이고 XY 수컷 접합자의 24개의 염색체는 이종이다.그 결과 XX암수 접합자의 C-값은 3.099361이고 XY암수 접합자의 C-값은 3.15787이다.

인간 게놈의 GC 함량은 약 41%[16]입니다.상염색체,[17] X염색체, Y염색체를 구성하는 인간의 반수체 GC 함량은 X염색체는 40.97460%, Y염색체는 41.01724%이다.

다음 숫자의 요약:

표 2: 인간 게놈 크기
감방 염색체 설명 유형 배수성 베이스 페어(bp) GC 내용(%) 밀도(Mbp/pg) 질량 (pg) C값
정자 또는 난자 23개의 이종 염색체 배우자 X 반수체 3,031,042,417 40.97460% 977.9571 3.099361 3.099361
정자만 23개의 이종 염색체 Y가메테 반수체 2,932,228,937 41.01724% 977.9564 2.998323 2.998323
접합자 각각 23개의 이종 염색체의 2개의 상동 염색체로 이루어진 46개의 염색체 XX 여성 이중배체 6,062,084,834 40.97460% 977.9571 6.198723 3.099361
접합자 각각 22개의 이종 염색체와 2개의 이종 염색체의 2개의 상동 염색체로 이루어진 46개의 염색체 XY 수컷 대부분 이배체 5,963,271,354 40.99557% 977.9567 6.097684 3.157877

「 」를 참조해 주세요.

레퍼런스

  1. ^ Greilhuber J, Doležel J, Lysák M, Bennett MD (2005). "The origin, evolution and proposed stabilization of the terms 'genome size' and 'C-value' to describe nuclear DNA contents". Annals of Botany. 95 (1): 255–60. doi:10.1093/aob/mci019. PMC 4246724. PMID 15596473.
  2. ^ Swift H (1950). "The constancy of deoxyribose nucleic acid in plant nuclei". Proceedings of the National Academy of Sciences of the USA. 36 (11): 643–654. Bibcode:1950PNAS...36..643S. doi:10.1073/pnas.36.11.643. PMC 1063260. PMID 14808154.
  3. ^ Gregory TR (2001). "Coincidence, coevolution, or causation? DNA content, cell size, and the C-value enigma". Biological Reviews. 76 (1): 65–101. doi:10.1017/S1464793100005595. PMID 11325054.
  4. ^ Gregory TR (2002). "A bird's-eye view of the C-value enigma: genome size, cell size, and metabolic rate in the class Aves". Evolution. 56 (1): 121–30. doi:10.1111/j.0014-3820.2002.tb00854.x. PMID 11913657.
  5. ^ a b c Bennett MD, Leitch IJ (2005). "Genome size evolution in plants". In T.R. Gregory (ed.). The Evolution of the Genome. San Diego: Elsevier. pp. 89–162.
  6. ^ Vendrely R, Vendrely C; Vendrely (1948). "La teneur du noyau cellulaire en acide désoxyribonucléique à travers les organes, les individus et les espèces animales : Techniques et premiers résultats". Experientia (in French). 4 (11): 434–436. doi:10.1007/bf02144998. PMID 18098821. S2CID 22272730.
  7. ^ a b Gregory T.R. (2005). "Genome size evolution in animals". In T.R. Gregory (ed.). The Evolution of the Genome. San Diego: Elsevier. pp. 3–87.
  8. ^ a b "Second Plant Genome Size Discussion Meeting and Workshop". Archived from the original on 2008-12-01. Retrieved 2015-04-19.
  9. ^ Vendrely R, Vendrely C (1948). "La teneur du noyau cellulaire en acide désoxyribonucléique à travers les organes, les individus et les espèces animales: Techniques et premiers résultats". Experientia. 4 (11): 434–436. doi:10.1007/bf02144998. PMID 18098821. S2CID 22272730.
  10. ^ Dawkins, Richard; Wong, Yan (2016). The Ancestor's Tale. ISBN 978-0544859937.
  11. ^ "Animal Genome Size Database". Retrieved 14 May 2013.
  12. ^ Elgar, G.; Vavouri, T. (2008). "Tuning in to the signals: Noncoding sequence conservation in vertebrate genomes". Trends in Genetics. 24 (7): 344–352. doi:10.1016/j.tig.2008.04.005. PMID 18514361.
  13. ^ a b c Doležel J, Bartoš J, Voglmayr H, Greilhuber J (2003). "Letter to the editor: Nuclear DNA Content and Genome Size of Trout and Human". Cytometry. 51A (2): 127–128. doi:10.1002/cyto.a.10013. PMID 12541287.
  14. ^ Lander, ES; Linton, LM; Birren, B; Nusbaum, C; Zody, MC; Baldwin, J; Devon, K; Dewar, K; et al. (2001). "International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome" (PDF). Nature. 409 (6822): 860–921. doi:10.1038/35057062. PMID 11237011.
  15. ^ "Assembly Statistics for GRCh38.p2". Genome Reference Consortium. 8 December 2014. Retrieved 8 February 2015.
  16. ^ Stylianos E. Antonarakis (2010). Vogel and Motulsky's Human Genetics: Problems and Approaches (PDF). Berlin Heidelberg: Springer-Verlag. p. 32. ISBN 978-3-540-37654-5. Archived from the original (PDF) on 24 September 2015. Retrieved 8 February 2015.
  17. ^ Kokocinski, Felix. "Bioinformatics work notes". GC content of human chromosomes. Archived from the original on 10 February 2015. Retrieved 8 February 2015.

외부 링크