쇼트올리고뉴클레오티드분석패키지

Short Oligonucleotide Analysis Package

SOAP(Short Olygonucleotide Analysis Package)는 차세대 DNA 배열 데이터의 조립, 정렬 및 분석을 가능하게 하는 BGI 생물정보학 부서의 생물정보학 소프트웨어 도구 모음입니다.특히 짧은 읽기 시퀀싱 데이터에 적합합니다.

SOAP 패키지의 모든 프로그램은 무료로 사용할 수 있으며 GPL 오픈소스 소프트웨어 라이선스에 따라 배포됩니다.

기능

SOAP 도구 세트를 사용하여 다음 게놈 어셈블리 작업을 수행할 수 있습니다.

시퀀스 얼라인먼트

SOAP2(SOAP2)는 짧은 읽기의 빠른 정렬을 위해 특별히 설계되었으며 Bowtie 및 MAQ와 [1]같은 유사한 정렬 도구에 비해 성능이 우수합니다.

게놈 어셈블리

SOAPdenovo는 De Bruijn 그래프 구조를 이용한 짧은 읽기novo 어셈블러입니다.일루미나가 생성하는 것과 같은 짧은 판독에 최적화되어 있으며 인간 게놈과 같은 [2]큰 게놈을 조립할 수 있습니다.SOAPDenovo자이언트 [3]판다의 게놈을 조립하는데 사용되었다.이것은 SOAPdenovo2로 업그레이드되었고, 이것은 큰 게놈에 최적화되었고 널리 사용되는 GapCloser [4]모듈을 포함하였습니다.

트랜스크립트콤 어셈블리

SOAPdenovo-Trans는 RNA-Seq용으로 특별히 설계된 [5]de novo transcriptome 어셈블러로, 1000 Plant Genomes 프로젝트를 위해 만들어졌습니다.

디스커버리 삭제

SOAPindel은 차세대 페어링 엔드 시퀀싱 데이터에서 삽입 및 삭제를 찾아내는 도구로, 품질 [6]점수가 포함된 후보 인델 목록을 제공합니다.

SNP 검출

SOAPsnp는 컨센서스 시퀀스빌더입니다이 툴은 SOAPaligner의 출력을 사용하여 컨센서스 시퀀스를 생성하여 새로 시퀀싱된 개인에게 SNP를 호출할 수 있도록 합니다.

구조변동 검출

SOAPsv는 전체 게놈 [7]어셈블리를 사용하여 구조적 변화를 찾는 도구입니다.

품질관리 및 전처리

SOAPnuke는 게놈,[8] 소형 RNA, 디지털 유전자 발현 및 메타제노믹 실험의 데이터셋을 통합 품질 제어 및 전처리하기 위한 도구입니다.

역사

SOAP v1

SOAP의 첫 번째 릴리스는 시퀀스 정렬 도구 SOAPaligner로만 [9]구성되었습니다.

SOAP v2

SOAP v2는 SOAP aligner 툴의 성능을 대폭 향상시킴으로써 SOAP v1로 확장 및 개선되었습니다.얼라인먼트 시간은 20~30배 감소했고 메모리 사용량은 3배 감소했습니다.압축 파일 형식에 대한 지원이 추가되었습니다.

SOAP 스위트는 SOAPdenovo 1&2, SOAPindel, SOAPsnp 및 SOAPsv라는 새로운 툴을 포함하도록 확장되었습니다.

SOAP v3

SOAP v3는 GPU [10]프로세서를 사용한 최초의 쇼트 리드 얼라인먼트 툴로서 얼라인먼트 툴을 확장했습니다.이러한 개선으로 SOAPalign은 속도 면에서 경쟁 얼라이너인 BowtieBWA를 크게 앞섰다.

「 」를 참조해 주세요.

외부 링크

레퍼런스

  1. ^ a b Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatics. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. ISSN 1367-4803. PMID 19497933.
  2. ^ Li, R.; Zhu, H.; Ruan, J.; Qian, W.; Fang, X.; Shi, Z.; Li, Y.; Li, S.; Shan, G.; Kristiansen, K.; Li, S.; Yang, H.; Wang, J.; Wang, J. (2009). "De novo assembly of human genomes with massively parallel short read sequencing". Genome Research. 20 (2): 265–272. doi:10.1101/gr.097261.109. ISSN 1088-9051. PMC 2813482. PMID 20019144.
  3. ^ Li, Ruiqiang; Fan, Wei; Tian, Geng; Zhu, Hongmei; He, Lin; Cai, Jing; Huang, Quanfei; Cai, Qingle; Li, Bo; Bai, Yinqi; Zhang, Zhihe; Zhang, Yaping; Wang, Wen; Li, Jun; Wei, Fuwen; Li, Heng; Jian, Min; Li, Jianwen; Zhang, Zhaolei; Nielsen, Rasmus; Li, Dawei; Gu, Wanjun; Yang, Zhentao; Xuan, Zhaoling; Ryder, Oliver A.; Leung, Frederick Chi-Ching; Zhou, Yan; Cao, Jianjun; Sun, Xiao; et al. (2009). "The sequence and de novo assembly of the giant panda genome". Nature. 463 (7279): 311–317. doi:10.1038/nature08696. ISSN 0028-0836. PMC 3951497. PMID 20010809.
  4. ^ Luo, Ruibang; Liu, Binghang; Xie, Yinlong; Li, Zhenyu; Huang, Weihua; Yuan, Jianying; He, Guangzhu; Chen, Yanxiang; Pan, Qi; Liu, Yunjie; Tang, Jingbo (2012-12-01). "SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler". GigaScience. 1 (1): 18. doi:10.1186/2047-217X-1-18. PMC 3626529. PMID 23587118.
  5. ^ Xie, Yinlong; Wu, Gengxiong; Tang, Jingbo; Luo, Ruibang; Patterson, Jordan; Liu, Shanlin; Huang, Weihua; He, Guangzhu; Gu, Shengchang; Li, Shengkang; Zhou, Xin (2014-06-15). "SOAPdenovo-Trans: de novo transcriptome assembly with short RNA-Seq reads". Bioinformatics. 30 (12): 1660–1666. doi:10.1093/bioinformatics/btu077. ISSN 1367-4803. PMID 24532719.
  6. ^ Li, Shengting; Li, Ruiqiang; Li, Heng; Lu, Jianliang; Li, Yingrui; Bolund, Lars; Schierup, Mikkel H.; Wang, Jun (2013-01-01). "SOAPindel: Efficient identification of indels from short paired reads". Genome Research. 23 (1): 195–200. doi:10.1101/gr.132480.111. ISSN 1088-9051. PMC 3530679. PMID 22972939.
  7. ^ Li, Yingrui; Zheng, Hancheng; Luo, Ruibang; Wu, Honglong; Zhu, Hongmei; Li, Ruiqiang; Cao, Hongzhi; Wu, Boxin; Huang, Shujia; Shao, Haojing; Ma, Hanzhou (August 2011). "Structural variation in two human genomes mapped at single-nucleotide resolution by whole genome de novo assembly". Nature Biotechnology. 29 (8): 723–730. doi:10.1038/nbt.1904. ISSN 1546-1696. PMID 21785424.
  8. ^ Chen, Yuxin; Chen, Yongsheng; Shi, Chunmei; Huang, Zhibo; Zhang, Yong; Li, Shengkang; Li, Yan; Ye, Jia; Yu, Chang; Li, Zhuo; Zhang, Xiuqing (2018-01-01). "SOAPnuke: a MapReduce acceleration-supported software for integrated quality control and preprocessing of high-throughput sequencing data". GigaScience. 7 (1): 1–6. doi:10.1093/gigascience/gix120. PMC 5788068. PMID 29220494.
  9. ^ Li, R.; Li, Y.; Kristiansen, K.; Wang, J. (2008). "SOAP: short oligonucleotide alignment program". Bioinformatics. 24 (5): 713–714. doi:10.1093/bioinformatics/btn025. ISSN 1367-4803. PMID 18227114.
  10. ^ Liu, C.-M.; Wong, T.; Wu, E.; Luo, R.; Yiu, S.-M.; Li, Y.; Wang, B.; Yu, C.; Chu, X.; Zhao, K.; Li, R.; Lam, T.-W. (2012). "SOAP3: ultra-fast GPU-based parallel alignment tool for short reads". Bioinformatics. 28 (6): 878–879. doi:10.1093/bioinformatics/bts061. ISSN 1367-4803. PMID 22285832.