국제 합맵 프로젝트
International HapMap Project국제합동지도 프로젝트는 인간의 유전적 변동의 일반적인 패턴을 설명하기 위해 인간 게놈의 하프형 지도(HapMap)를 개발하는 것을 목표로 한 기구였다. HapMap은 건강, 질병, 약물 및 환경적 요인에 대한 반응에 영향을 미치는 유전적 변형을 찾는 데 사용된다. 그 프로젝트에서 생산한 정보는 자유롭게 연구할 수 있도록 되어 있다.
국제합동지도 프로젝트는 캐나다, 중국(홍콩 포함), 일본, 나이지리아, 영국, 미국의 학술센터, 비영리 생물의학연구단체, 민간기업 등의 연구자들이 협업한 프로젝트다. 공식적으로는 2002년 10월 27일부터 29일까지의 회의로 시작해 약 3년이 걸릴 것으로 예상됐다. 그것은 두 단계로 구성된다; 1단계에서 얻은 완전한 데이터는 2005년 10월 27일에 발표되었다.[1] 2단계 데이터 집합의 분석은 2007년 10월에 발표되었다.[2] 3단계 데이터 집합은 2009년 봄에 발표되었고, 최종 결과는 2010년 9월에 발표되었다.[3]
배경
희귀한 멘델병과는 달리 다른 유전자와 환경의 결합은 일반적인 질병(당뇨병, 암, 심장병, 뇌졸중, 우울증, 천식 등)의 발생과 진행이나 약리학적 작용에 대한 개별적인 반응에 역할을 한다. 이러한 질병에 관련된 유전적 요인을 찾기 위해, 원칙적으로 유전체 전반에 걸친 연관성 연구를 할 수 있다: 몇몇은 질병에 걸렸고 몇몇은 그렇지 않은 몇몇 개인은 완전한 유전적 염기서열을 얻은 다음, 두 세트의 게놈들 사이의 차이점을 찾을 수 있다. 당시에는 완전한 게놈 염기서열 분석 비용 때문에 이 접근법이 실현 가능하지 않았다. HapMap 프로젝트는 지름길을 제안했다.
비록 관련이 없는 두 사람이 그들의 DNA 염기서열의 약 99.5%를 공유하지만, 그들의 게놈은 특정한 뉴클레오티드 위치에서 다르다. 그러한 부위는 단일 뉴클레오티드 다형성(SNP)으로 알려져 있으며, 가능한 결과 유전자 형태 각각을 알레르라고 한다. HapMap 프로젝트는 최소 1%의 인구에서 각 문제가 발생하는 공통 SNP에만 초점을 맞춘다.
각 사람은 수컷의 성염색체를 제외한 모든 염색체의 복제본을 2개씩 가지고 있다. 각 SNP에 대해, 한 사람이 가지고 있는 알레르기의 조합을 유전자형이라고 한다. 유전자형(genotyping)은 특정 사이트에서 어떤 유전자형이 있는지 밝혀내는 것을 말한다. 합맵 프로젝트는 269명의 개인 표본을 선정해 수백만의 잘 정의된 SNP를 선정해 이들 SNP에 대해 유전자형을 만들고 결과를 발표했다.
단일 염색체에 대한 주변 SNP의 대립은 상관관계가 있다. 구체적으로는 특정 개인에 대한 SNP 1개의 알레르기가 알려진 경우, 인근 SNP의 알레르기를 예측할 수 있는 경우가 많다. 왜냐하면 각각의 SNP가 하나의 점 돌연변이로 진화 역사에서 생겨났고, 그 후 다른 점 돌연변이로 둘러싸인 염색체 위에서 전해졌기 때문이다. 염색체에서 큰 거리로 분리되는 SNP는 각 세대에 재조합이 일어나 두 염색체의 알레르 시퀀스를 혼합하기 때문에 일반적으로 그다지 상관관계가 좋지 않다. 특정 염색체에 일련의 연속적인 알레르기는 하플로타입이라고 알려져 있다.
특정 질병과 관련된 유전적 요인을 찾기 위해서는 다음과 같이 진행하면 된다. 먼저 게놈에 대한 특정 관심 영역이 확인되는데, 아마도 이전의 상속 연구에서 확인되었을 것이다. 이 영역에서는 HapMap 데이터에서 태그 SNP 집합을 찾는다. 이 태그는 해당 지역의 다른 모든 SNP와 매우 잘 상관되는 SNP이다. 따라서 태그 SNP의 알레르기를 개인에서 학습하면 높은 확률로 개인의 happlotype을 결정할 것이다. 다음으로, 몇몇은 질병에 걸린 사람이고 일부는 없는 사람이고 몇몇은 그렇지 않은 사람에서 이러한 태그 SNP의 유전자형을 결정한다. 이 두 집단을 비교함으로써 질병에 관여할 가능성이 있는 장소와 하모형을 결정한다.
사용된 샘플
happlotype은 일반적으로 모집단 간에 공유되지만 빈도는 크게 다를 수 있다. 합맵에는 나이지리아 이바단 출신의 성인과 양친인 요루바 트리오 30명, 북유럽과 서유럽 조상의 유타 주민 30명, 일본 도쿄(JPT) 출신 무관 일본인 44명, 중국 베이징(CHB) 무관 한족 45명 등 4명이 포함됐다. 이러한 모집단으로부터 밝혀진 happlotype은 많은 다른 모집단을 연구하는데 유용해야 하지만, 병렬 연구는 현재 프로젝트에 추가 모집단을 포함시키는 것의 유용성을 조사하고 있다.
모든 샘플은 적절한 사전 동의를 얻어 지역사회 참여 과정을 통해 수집되었다. 지역사회 참여 과정은 문화적으로 특정한 관심사를 식별하고 이에 대응하려고 시도하며 참여 지역사회가 사전동의와 샘플 수집 프로세스에 의견을 제시할 수 있도록 설계되었다.[4]
In phase III, 11 global ancestry groups have been assembled: ASW (African ancestry in Southwest USA); CEU (Utah residents with Northern and Western European ancestry from the CEPH collection); CHB (Han Chinese in Beijing, China); CHD (Chinese in Metropolitan Denver, Colorado); GIH (Gujarati Indians in Houston, Texas); JPT (Japanese in Tokyo, Japan); LWK(케냐주 웨부예의 루히야), MEX(캘리포니아주 로스앤젤레스에서 멕시코 혈통), MKK(케냐주 키냐와의 마사이); TSI(이탈리아의 Tussians); YRI(나이지리아 이바단의 Yoruba)[5]
위상 | 아이디 | 장소 | 인구 | 디테일 |
---|---|---|---|---|
I/II | CEU | ![]() | CEPH 컬렉션의 북유럽과 서유럽 조상을 가진 유타 주민 | 디테일 |
I/II | CHB | ![]() | 중국 베이징의 한족 | 디테일 |
I/II | JPT | ![]() | 일본 도쿄의 일본인 | 디테일 |
I/II | YRI | ![]() | 나이지리아 이바단의 요루바 | 디테일 |
III | ASW | ![]() | 미국 남서부의 아프리카 조상 | 디테일 |
III | CHD | ![]() | 미국 캘리포니아 주 덴버의 중국어 | 디테일 |
III | GIH | ![]() | 미국 TX 휴스턴의 구자라티 인디언 | 디테일 |
III | 루크 | ![]() | 케냐 웨부예의 루하 | 디테일 |
III | MKK | ![]() | 케냐 키냐와에 있는 마사이 | 디테일 |
III | MXL | ![]() | 미국 로스앤젤레스의 멕시코 조상 | 디테일 |
III | TSI | ![]() | 토스카니 인 이탈리아 | 디테일 |
Three combined panels have also been created, which allow better identification of SNPs in groups outside the nine homogenous samples: CEU+TSI (Combined panel of Utah residents with Northern and Western European ancestry from the CEPH collection and Tuscans in Italy); JPT+CHB (Combined panel of Japanese in Tokyo, Japan and Han Chinese in Beijing, C히나)와 JPT+CHB+CHD(일본 도쿄의 일본어, 중국 베이징의 한족, 콜로라도의 메트로폴리탄 덴버의 중국어 결합 패널). 예를 들어, CEU+TSI는 CEU만의 모델보다 영국 개인들의 더 나은 모델이다.[5]
과학 전략
1990년대에는 환자의 게놈 전체를 염기서열로 배열하는 것이 비쌌다. 그래서 국립보건원은 많은 사람들이 변형된 DNA 단위를 가지고 있는 게놈의 사이트들을 살펴보는 "짧은 컷"에 대한 아이디어를 받아들였다. 그 지름길의 이면에 있는 이론은, 주요 질병들이 흔하기 때문에, 그것들을 야기시킨 유전적 변종들 역시 마찬가지일 것이라는 것이었다. 자연선택은 인간의 게놈에 아이들이 자라기 전에 건강을 해치는 변형이 없도록 유지시켜 주지만, 그 이론은 나중에 발생하는 변종들에 대해서는 실패하여 꽤 흔한 변종이 될 수 있게 한다(National Institute of Health) 2002년에 HapMap이라는 1억 3천 8백만 달러짜리 프로젝트를 시작하여 유럽, E.아시아와 아프리카 게놈).[6]
1단계에서는 5천 베이스마다 하나의 일반적인 SNP가 유전자형으로 처리되었다. 전체적으로 100만 명 이상의 SNP가 유전자형으로 만들어졌다. 유전자형은 5가지 다른 유전자형 기술을 사용하여 10센트에 의해 수행되었다. 유전자형 품질은 중복 또는 관련 샘플을 사용하고 센터가 공통의 SNP 세트의 유전자형을 만들어야 하는 곳에서 정기적인 품질 검사를 통해 평가되었다.
캐나다 팀은 토마스 J가 이끌었다. 몬트리올 맥길 대학의 허드슨은 염색체 2와 4p에 초점을 맞췄다. 중국 팀은 베이징과 상하이에서 양환밍, 홍콩에서는 랍치추이가 이끌었고 염색체 3, 8p, 21에 집중했다. 일본팀은 도쿄대학 나카무라 유스케가 이끌었고 염색체 5, 11, 14, 15, 16, 17, 19에 초점을 맞췄다. 영국 팀은 데이비드 R이 이끌었다. 생어 연구소의 벤틀리는 염색체 1, 6, 10, 13, 20에 초점을 맞췄다. There were four United States' genotyping centres: a team led by Mark Chee and Arnold Oliphant at Illumina Inc. in San Diego (studying chromosomes 8q, 9, 18q, 22 and X), a team led by David Altshuler and Mark Daly at the Broad Institute in Cambridge, USA (chromosomes 4q, 7q, 18p, Y and mitochondrion), a team led by Richard Gibbs at the Baylor Coll휴스턴의 의학의 에지(크롬소메 12), 샌프란시스코 캘리포니아 대학의 푸이옌 궈(Pui-Yan Kwok) 팀(크롬소메 7p)이다.
지도를 만들기에 충분한 SNP를 얻기 위해, 컨소시엄은 수백만 개의 추가 SNP를 발견하기 위한 대규모 재시퀀싱 프로젝트에 자금을 지원했다. 이것들은 공공 dbSNP 데이터베이스에 제출되었다. 그 결과 2006년 8월까지 데이터베이스에는 1000만 대 이상의 SNP가 포함되었으며, 이 중 40% 이상이 다형성인 것으로 알려졌다. 이에 비해 사업 초기에는 300만 대 미만의 SNP가 확인됐으며 이중 다형성인 경우는 10% 이하인 것으로 알려졌다.
2단계 동안, David R에 의해 게놈 전체에 걸쳐 2백만 개 이상의 추가 SNP가 유전자형으로 만들어졌다. 콕스, 켈리 A. Frazer 등은 Perlegen Sciences에서 50만 명, Apfymetrix사가 50만 명을 보유하고 있다.
데이터 액세스
SNP 주파수, 유전자형, 하플로타형 등 프로젝트에서 생성된 모든 데이터는 공공영역에 배치돼 다운로드가 가능하다.[7] 이 웹사이트는 또한 관심 영역, 이의 제기 빈도 및 인근 SNP와의 연관성을 찾을 수 있는 게놈 브라우저를 포함하고 있다. 특정 관심 영역에 대한 태그 SNP를 결정할 수 있는 툴도 제공된다. 이러한 데이터는 널리 사용되는 Haploview 프로그램에서도 직접 액세스할 수 있다.
출판물
- International HapMap Consortium (2003). "The International HapMap Project" (PDF). Nature. 426 (6968): 789–796. Bibcode:2003Natur.426..789G. doi:10.1038/nature02168. hdl:2027.42/62838. PMID 14685227.
- International HapMap Consortium (2004). "Integrating ethics and science in the International HapMap Project". Nature Reviews Genetics. 5 (6): 467–475. doi:10.1038/nrg1351. PMC 2271136. PMID 15153999.
- International HapMap Consortium (2005). "A haplotype map of the human genome". Nature. 437 (7063): 1299–1320. Bibcode:2005Natur.437.1299T. doi:10.1038/nature04226. PMC 1880871. PMID 16255080.
- International HapMap Consortium (2007). "A second generation human haplotype map of over 3.1 million SNPs". Nature. 449 (7164): 851–861. Bibcode:2007Natur.449..851F. doi:10.1038/nature06258. PMC 2689609. PMID 17943122.
- International HapMap 3 Consortium (2010). "Integrating common and rare genetic variation in diverse human populations". Nature. 467 (7311): 52–58. Bibcode:2010Natur.467...52T. doi:10.1038/nature09298. PMC 3173859. PMID 20811451.
- Deloukas P, Bentley D (2004). "The HapMap project and its application to genetic studies of drug response". The Pharmacogenomics Journal. 4 (2): 88–90. doi:10.1038/sj.tpj.6500226. PMID 14676823.
- Thorisson GA, Smith AV, Krishnan L, Stein LD (2005). "The International HapMap Project Web site". Genome Research. 15 (11): 1592–1593. doi:10.1101/gr.4413105. PMC 1310647. PMID 16251469.
- Terwilliger JD, Hiekkalinna T (2006). "An utter refutation of the 'Fundamental Theorem of the HapMap'". European Journal of Human Genetics. 14 (4): 426–437. doi:10.1038/sj.ejhg.5201583. PMID 16479260.
- 세코, 다윗(2005년). "HapMap Complete 1단계" 더 사이언티스트
참고 항목
참조
- ^ Altshuler, David; Donnelly, Peter; The International HapMap Consortium (October 2005). "A haplotype map of the human genome". Nature. 437 (7063): 1299–1320. doi:10.1038/nature04226. ISSN 1476-4687. PMC 1880871. PMID 16255080.
- ^ Frazer, Kelly A.; Ballinger, Dennis G.; Cox, David R.; Hinds, David A.; Stuve, Laura L.; Gibbs, Richard A.; Belmont, John W.; Boudreau, Andrew; Hardenbol, Paul; Leal, Suzanne M.; Pasternak, Shiran (October 2007). "A second generation human haplotype map of over 3.1 million SNPs". Nature. 449 (7164): 851–861. doi:10.1038/nature06258. hdl:2027.42/62863. ISSN 1476-4687. PMC 2689609. PMID 17943122.
- ^ Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Altshuler, David M.; Gibbs, Richard A.; Peltonen, Leena; Dermitzakis, Emmanouil; Schaffner, Stephen F.; Yu, Fuli; Peltonen, Leena; Dermitzakis, Emmanouil (September 2010). "Integrating common and rare genetic variation in diverse human populations". Nature. 467 (7311): 52–58. doi:10.1038/nature09298. ISSN 1476-4687. PMC 3173859. PMID 20811451.
- ^ Rotimi, Charles; Leppert, Mark; Matsuda, Ichiro; Zeng, Changqing; Zhang, Houcan; Adebamowo, Clement; Ajayi, Ike; Aniagwu, Toyin; Dixon, Missy; Fukushima, Yoshimitsu; Macer, Darryl (2007). "Community Engagement and Informed Consent in the International HapMap Project". Public Health Genomics. 10 (3): 186–198. doi:10.1159/000101761. ISSN 1662-4246. PMID 17575464.
- ^ Jump up to: a b 국제합동맵 컨소시엄 외 (2010) 다양한 인구에 공통적이고 희귀한 유전적 변이를 통합한다. 자연, 467, 52-8. 도이
- ^ Naidoo N, Pawitan Y, Soong R, Cooper DN, Ku CS (October 2011). "Human genetics and genomics a decade after the release of the draft sequence of the human genome". Human Genomics. 5 (6): 577–622. doi:10.1186/1479-7364-5-6-577. PMC 3525251. PMID 22155605.
- ^ Thorisson, Gudmundur A.; Smith, Albert V.; Krishnan, Lalitha; Stein, Lincoln D. (2005-11-01). "The International HapMap Project Web site". Genome Research. 15 (11): 1592–1593. doi:10.1101/gr.4413105. ISSN 1088-9051. PMC 1310647. PMID 16251469.