F-통계학
F-statistics모집단 유전학에서 F-통계학(일명 고정 지수)은 모집단에서 통계적으로 기대되는 이형성 수준을 설명한다. 구체적으로는 하디-웨인버그 예상과 비교할 때 (일반적으로) 이형성 감소의 정도를 설명한다.
F-통계학은 다른 (계층적으로) 세분화된 모집단의 수준에서 그려진 유전자 사이의 상관관계를 측정하는 척도로도 생각할 수 있다. 이 상관관계는 유전적 표류, 창시자 효과, 병목현상, 유전적 히치하이킹, 감수운동, 돌연변이, 유전자 흐름, 교배, 자연선택, 와룬드 효과 등 여러 진화 과정의 영향을 받지만, 원래 유전적 표류에 의한 알레르기의 고정 정도를 측정하기 위해 설계되었다.
F-통계학의 개념은 1920년대에 미국의 유전학자 세월 라이트(Sewall Wright)에 의해 개발되었는데,[1][2] 그는 소에 대한 교배에 관심이 있었다. 그러나 완전한 지배로 인해 동형유전자와 이형유전자의 표현형이 같아지기 때문에 1960년대 이후 분자유전학이 등장하고 나서야 모집단의 이형성도를 측정할 수 있었다.
F는 유효 모집단 크기를 정의하는 데 사용될 수 있다.[further explanation needed]
정의 및 방정식
FIS, FST, F는IT 다양한 수준의 인구 구조에서 이질성의 양과 관련이 있다. 함께 F-통계라고 하며, 교배계수인 F에서 도출된다. 교배가 있는 단순한 2알레 시스템에서 유전자형 주파수는 다음과 같다.
F의 값은 위의 삽입 모집단에서 이형체를 사용하여 F에 대한 방정식을 풀면 알 수 있다. 이는 하디-웨인버그 평형에서 이형체들의 예상 빈도로 나눈 모집단에서 이형체들의 관측 빈도를 1에서 뺀 값이 된다.
여기서 Hardy-Weinberg 평형에서 예상되는 주파수는 다음과 같다.
여기서 p와 q는 각각 A와 a의 알레 빈도다. 그것은 또한 어떤 위치에서도 인구의 무작위적인 개인으로부터 오는 두 개의 대립이 혈통에 의해 동일할 확률이다.
예를 들어, E.B의 데이터를 고려하십시오. 포드(1971)는 주홍색 호랑이 나방의 단일 개체군에 대해 다음과 같이 말했다.
| 유전자형 | 흰색 점(AA) | 중간(Aa) | 작은 얼룩(aa) | 합계 |
|---|---|---|---|---|
| 숫자 | 1469 | 138 | 5 | 1612 |
이로부터 알레르 주파수를 계산할 수 있으며, ƒ(Aa)의 기대치는 다음과 같이 도출된다.
다른 F-통계학은 다른 수준의 인구 구조를 살펴본다. 개별(나는)총(T)인구에 비례의 애크런에서 건강한 독자는 교배 계수, 위에서 언급했던 것;개별(나는)은 특정 생물형군(S)에 상대적인 FIS은 교배 계수, 위 subpopulations에 평균이 사용하고 총 숫자와 부차의 에프에스티 영향이 전체 인구(T)에 비해(S)에 계산한다.sol방정식의 빈:
다음 절에 나타난 바와 같이
모집단 구조로 인한 분할
개인(I)에서 하위 모집단(S)까지와 하위 모집단(S)에서 전체(T)까지 두 가지 수준의 인구 구조를 가진 모집단을 고려해 보십시오. 그러면 여기서 F로IT 알려진 총 F는 FIS(또는 f)와 FST(또는 θ)로 분할할 수 있다.
이는 인구 하부 구조에 대해 추가로 분할될 수 있으며, I 파티션에 대해 다음과 같이 이항 확장 규칙에 따라 확장된다.
고정 지수
F의 정의의 개정은 개체군에서 무작위로 염색체를 추출할 때 얻은 평균 숫자와 함께 디플로이드 개인 내에서 샘플링된 염색체 쌍 간의 평균 차이 수의 비율이다(개별 그룹화는 제외). 이 정의를 수정하고 개인당 그룹화를 고려할 수 있다. 인구유전학자들은 그 아이디어를 인구구조 정도를 측정하는데 사용했다.
불행히도 F에ST 대한 정의가 많아 과학 문헌에 약간의 혼란을 초래하고 있다. 일반적인 정의는 다음과 같다.
여기서 p의 분산을 하위 항목에서 계산하고 p(1-p)는 이형체들의 예상 빈도수다.
인구 고정 지수
유전적 다양성의 분포는 대략적으로 추정했을 뿐이지만,[3] 인간들 사이의 유전적 다양성이 낮다는 것은 잘 입증되어 있다. 초기 연구에서는 유전적 변동의 85~90%가 대륙 내 동일한 모집단에 거주하는 개인(대륙 내 인구) 내에서 발견되며, 다른 대륙의 인구(대륙 인구) 사이에서 추가로 10~15%만 발견된다고 주장했다.[4][5][6][7][8] 이후 연구들 수천명 수백명을 기준으로single-nucleotide 다형성(SNPs)이 대륙 인구 간의 유전적 다양성 심지어 차지하는 3대 7%를 SNPs은 유전적 변이의 12%대륙 인구와 1%사이에서 발견된 것으로 나타났다 늦게 연구가 3만을 바탕으로[9][10][11][12][13][14] 작다고 주장했다.그들 안에 있다.[15] 이러한 연구들의 대부분은 FST 통계나 밀접하게 관련된 통계를 사용해 왔다.[17][18]
참고 항목
참조
- ^ Wright, S (1950). "Genetical structure of populations". Nature. 166 (4215): 247–9. Bibcode:1950Natur.166..247W. doi:10.1038/166247a0. PMID 15439261. S2CID 36311175.
- ^ Kulig, K (1985). "Utilization of emergency toxicology screens". The American Journal of Emergency Medicine. 3 (6): 573–4. doi:10.1016/0735-6757(85)90177-9. LCCN 67025533. PMID 4063030.
- ^ Holsinger, Kent E.; Weir, Bruce S. (2009). "Genetics in geographically structured populations: Defining, estimating and interpreting FST". Nature Reviews Genetics. 10 (9): 639–50. doi:10.1038/nrg2611. PMC 4687486. PMID 19687804.
- ^ Lewontin (1972). "The apportionment of human diversity". Evolutionary Biology. 6: 381–98. doi:10.1007/978-1-4684-9063-3_14. ISBN 978-1-4684-9065-7.
- ^ Bowcock, Anne M.; Kidd, Judith R.; Mountain, Joanna L.; Herbert, Joan M.; Carotenuto, Luciano; Kidd, Kenneth K.; Cavalli-Sforza, Luca (1991). "Drift, admixture, and selection in human evolution: A study with DNA polymorphisms". Proceedings of the National Academy of Sciences. 88 (3): 839–43. Bibcode:1991PNAS...88..839B. doi:10.1073/pnas.88.3.839. JSTOR 2356081. PMC 50909. PMID 1992475.
- ^ Barbujani, Guido; Magagni, Arianna; Minch, Eric; Cavalli-Sforza, L. Luca (1997). "An apportionment of human DNA diversity". Proceedings of the National Academy of Sciences of the United States of America. 94 (9): 4516–9. Bibcode:1997PNAS...94.4516B. doi:10.1073/pnas.94.9.4516. JSTOR 42042. PMC 20754. PMID 9114021.
- ^ Jorde, L.B.; Watkins, W.S.; Bamshad, M.J.; Dixon, M.E.; Ricker, C.E.; Seielstad, M.T.; Batzer, M.A. (2000). "The Distribution of Human Genetic Diversity: A Comparison of Mitochondrial, Autosomal, and Y-Chromosome Data". The American Journal of Human Genetics. 66 (3): 979–88. doi:10.1086/302825. PMC 1288178. PMID 10712212.
- ^ Jorde, Lynn B; Wooding, Stephen P (2004). "Genetic variation, classification and 'race'". Nature Genetics. 36 (11s): S28-33. doi:10.1038/ng1435. PMID 15508000.
- ^ Mahasirimongkol, Surakameth; Chantratita, Wasun; Promso, Somying; Pasomsab, Ekawat; et al. (2006). "Similarity of the allele frequency and linkage disequilibrium pattern of single nucleotide polymorphisms in drug-related gene loci between Thai and northern East Asian populations: Implications for tagging SNP selection in Thais". Journal of Human Genetics. 51 (10): 896–904. doi:10.1007/s10038-006-0041-1. PMID 16957813.
- ^ Hannelius, Ulf; Salmela, Elina; Lappalainen, Tuuli; Guillot, Gilles; Lindgren, Cecilia M; Von Döbeln, Ulrika; Lahermo, Päivi; Kere, Juha (2008). "Population substructure in Finland and Sweden revealed by the use of spatial coordinates and a small number of unlinked autosomal SNPs". BMC Genetics. 9: 54. doi:10.1186/1471-2156-9-54. PMC 2527025. PMID 18713460.
- ^ Lao, Oscar; Lu, Timothy T.; Nothnagel, Michael; Junge, Olaf; et al. (2008). "Correlation between Genetic and Geographic Structure in Europe". Current Biology. 18 (16): 1241–8. doi:10.1016/j.cub.2008.07.049. PMID 18691889.
- ^ Biswas, Shameek; Scheinfeldt, Laura B.; Akey, Joshua M. (2009). "Genome-wide Insights into the Patterns and Determinants of Fine-Scale Population Structure in Humans". The American Journal of Human Genetics. 84 (5): 641–650. doi:10.1016/j.ajhg.2009.04.015. PMC 2681007. PMID 19442770.
- ^ Nelis, Mari; Esko, Tõnu; Mägi, Reedik; Zimprich, Fritz; et al. (2009). Fleischer, Robert C (ed.). "Genetic Structure of Europeans: A View from the North–East". PLOS ONE. 4 (5): e5472. Bibcode:2009PLoSO...4.5472N. doi:10.1371/journal.pone.0005472. PMC 2675054. PMID 19424496.
- ^ Reich, David; Thangaraj, Kumarasamy; Patterson, Nick; Price, Alkes L.; et al. (2009). "Reconstructing Indian population history". Nature. 461 (7263): 489–94. Bibcode:2009Natur.461..489R. doi:10.1038/nature08365. PMC 2842210. PMID 19779445.
- ^ Elhaik, E (2012). "Empirical Distributions of FST from Large-Scale Human Polymorphism Data". PLOS ONE. 7 (11): e49837. Bibcode:2012PLoSO...749837E. doi:10.1371/journal.pone.0049837. PMC 3504095. PMID 23185452.
- ^ Wright, Sewall (1965). "The Interpretation of Population Structure by F-Statistics with Special Regard to Systems of Mating". Evolution. 19 (3): 395–420. doi:10.2307/2406450. JSTOR 2406450.
- ^ Shalev, B. A.; Dvorin, A.; Herman, R.; Katz, Z.; Bornstein, S. (1991). "Long-term goose breeding for egg production and crammed liver weight". British Poultry Science. 32 (4): 703–9. doi:10.1080/00071669108417396. PMID 1933444.
- ^ Excoffier, L; Smouse, PE; Quattro, JM (1992). "Analysis of molecular variance inferred from metric distances among DNA haplotypes: Application to human mitochondrial DNA restriction data". Genetics. 131 (2): 479–91. doi:10.1093/genetics/131.2.479. PMC 1205020. PMID 1644282.