ABI 솔리드 시퀀싱

ABI Solid Sequencing
SOLiD 플랫폼을 위한 라이브러리 준비
2-base 인코딩 방식. 2베이스 인코딩에서는 프로브 끝의 각 고유 쌍에 가능한 4가지 색상 중 1개가 할당된다. 예를 들어, "AA"는 파란색으로, "AC"는 녹색으로, 16개의 모든 고유 쌍에 대해 할당된다. 시퀀싱 중에 템플릿의 각 베이스는 두 번 시퀀싱되며, 결과 데이터는 이 계획에 따라 디코딩된다.

SOLiD(Sequencing by Oligonucleotide Lavigation and Detection)는 Life Technologies에서 개발한 차세대 DNA 염기서열 기술로 2006년부터 상용화되었다. 이 차세대 기술은 한 번에 108~10개의9 작은 시퀀스 읽기를 생성한다. 시퀀싱 플랫폼에 의해 생성된 원시 데이터를 시퀀스 데이터로 디코딩하기 위해 2 베이스 인코딩을 사용한다.

이 방법은 로슈-454 파이로시퀀싱(2005년 도입, 2009년 번의 200-400bp읽기 생성 수백만)에서 사용하는 원리인"합성에 의한 시퀀싱"과 Solexa 시스템(2006년 도입, 2009년수억번의 50-100bp 읽기 생성)을혼동해서는 안 된다.

이 방법들은 2004년 베이스당 $0.01에서 2006년 베이스당 $0.0001로 비용을 절감했고, 시퀀싱 용량을 2004년 100만 베이스/머신/일 단위에서 2009년 500억 베이스/일 단위 이상으로 늘렸다. Valouev 등으로부터 뉴클레오솜 위치설정에 먼저 사용,[1] Clunan 등과의 전사 프로파일링 또는 Strand 민감 RNA-Seq 등,[2] [3]Tang 등과의 단일 세포 전사 프로파일링, 그리고 궁극적으로 McKernan 등과의 인간 재시퀀싱에 대해 기술하는 30개 이상의 출판물이 존재한다.[4]

이 기계에서 사용하는 방법(순서별)은 일부 문제 시퀀싱 팔레드로믹 시퀀스를 갖는 것으로 보고되었다.[5]

화학

DNA 조각의 라이브러리는 배열할 샘플로부터 준비되며, 클론 비드 집단을 준비하는 데 사용된다. 즉, 각 자석 구슬의 표면에 단 한 종의 파편만이 존재할 것이다. 자석 비드에 부착된 파편에는 모든 파편의 시작 시퀀스가 알려지고 동일하도록 범용 P1 어댑터 시퀀스가 부착된다. 에멀전 PCR은 PCR에 필요한 모든 시약이 들어 있는 마이크로 리액터에서 발생한다. 결과 PCR 제품이 있는 비드는 유리 슬라이드에 침전된다.

프리머는 라이브러리 템플릿 내의 P1 어댑터 시퀀스에 따라 혼합된다. 형광 라벨이 부착된 4개의 디베이스 프로브 세트가 시퀀싱 프라이머에 연결하기 위해 경쟁한다. di-base 프로브의 특수성은 각 레인지 반응에서 1루와 2루마다 취조함으로써 달성된다. 최종 판독 길이를 결정하는 사이클 수에 따라 여러 사이클의 레인지, 검출 및 갈라짐이 수행된다. 일련의 레인지 사이클 후에 연장 제품을 제거하고 2차 레인지 사이클 동안 n-1 위치를 보완하는 프라이머로 템플릿을 재설정한다.

각 시퀀스 태그에 대해 5라운드의 프라이머 리셋이 완료된다. 프라이머 리셋 과정을 통해 각 베이스는 서로 다른 프라이머에 의해 두 개의 독립적인 레그 리액션으로 취조된다. 예를 들어, 읽기 위치 5의 베이스는 레인지 사이클 2의 프라이머 2번과 레인지 사이클 1의 프라이머 3번으로 측정한다.

처리량 & 정확도

ABI에 따르면 SOLiD 3+ 플랫폼은 실행당 60기가베이스의 사용 가능한 DNA 데이터를 산출한다. 2base 인코딩 시스템으로 인해 고유 정확도 점검이 기술에 내장되어 99.94%의 정확도를 제공한다. 또한 계통의 화학성은 로슈 454 FLX 계통과는 달리 호모폴리머에 의해 방해받지 않는다는 것을 의미하며, 따라서 크고 어려운 호모폴리머 반복 영역이 더 이상 시퀀싱에 문제가 되지 않는다.

적용들

당연히 이 기술은 DNA의 염기서열 분석을 위해 사용될 것이지만, 모든 차세대 기술의 높은 병렬 특성 때문에 그들은 또한 transcriptomics후생유전체학에도 응용할 수 있다.

마이크로레이는 지난 10년 동안 한 때 성적표학의 주축이었고, 이후 어레이 기반 기술은 다른 분야로 확장되었다. 다만 칩에 탑재된 프로브에 대해서는 정보만 얻을 수 있다는 점에서 한계가 있다. 칩이 이용 가능한 유기체에 대한 정보만이 얻을 수 있고, 그것들은 많은 수의 분자를 혼합하는 모든 문제를 동반한다. 다음 유전자 염기서열에 의한 RNA-Seq transcriptomics는 이러한 장벽들이 더 이상 진실하지 않다는 것을 의미할 것이다. 어떤 유기체의 전체 성적 증명서는 잠재적으로 한 번의 실행으로 배열될 수 있으며(매우 작은 박테리아 게놈의 경우)각 성적 증명서의 식별이 가능할 뿐만 아니라 양적 판독도 달성될 수 있으므로 표현 프로파일링이 가능하다.

크로마틴 면역소모(ChIP)는 전사 인자 결합 부위와 DNA-단백질 상호작용을 결정하는 방법이다. 과거 어레이 기술(Chip-chip)과 결합해 어느 정도 성공을 거둔 바 있다. 다음 gen 시퀀싱도 이 영역에 적용할 수 있다. Methylation 면역소모증(MeDIP)도 수행할 수 있으며 배열에서도 수행할 수 있다.

게놈 넓은 스케일로 메틸화와 TF 결합 사이트에 대해 더 많이 배울 수 있는 능력은 귀중한 자원이며 질병과 분자생물학 전반에 대해 우리에게 많은 것을 가르쳐 줄 수 있을 것이다.

참고 항목

참조

  1. ^ Valouev A, Ichikawa J, Tonthat T, et al. (July 2008). "A high-resolution, nucleosome position map of C. elegans reveals a lack of universal sequence-dictated positioning". Genome Research. 18 (7): 1051–63. doi:10.1101/gr.076463.108. PMC 2493394. PMID 18477713.
  2. ^ Cloonan N, Forrest AR, Kolle G, et al. (July 2008). "Stem cell transcriptome profiling via massive-scale mRNA sequencing". Nature Methods. 5 (7): 613–9. doi:10.1038/nmeth.1223. PMID 18516046. S2CID 19790151.
  3. ^ Tang F, Barbacioru C, Wang Y, et al. (May 2009). "mRNA-Seq whole-transcriptome analysis of a single cell". Nature Methods. 6 (5): 377–82. doi:10.1038/nmeth.1315. PMID 19349980. S2CID 16570747.
  4. ^ McKernan KJ, Peckham HE, Costa GL, et al. (September 2009). "Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding". Genome Research. 19 (9): 1527–41. doi:10.1101/gr.091868.109. PMC 2752135. PMID 19546169.
  5. ^ Yu-Feng Huang; Sheng-Chung Chen; Yih-Shien Chiang & Tzu-Han Chen (2012). "Palindromic sequence impedes sequencing-by-ligation mechanism". BMC Systems Biology. 6 Suppl 2: S10. doi:10.1186/1752-0509-6-S2-S10. PMC 3521181. PMID 23281822.

추가 읽기