보타이(시퀀스 분석)

Bowtie (sequence analysis)
보타이
원저작자벤 랭미드
콜 트랩넬
미하이팝
스티븐 솔즈버그
개발자벤 랭미드
안정된 릴리스
보타이1.3.0 / 2020년7월 22일, 2년 전(2020-07-22)[1]
보타이 22.4.2 / 2020년 10월 5일, 21개월 전(2020-10-05)[2]
저장소Bowtie : github.com/BenLangmead/bowtie
Bowtie 2 : github.com/BenLangmead/bowtie2
기입처C++
운영 체제리눅스
MacOS
창문들
유형생물정보학
웹 사이트www.bowtie-bio.sourceforge.net

Bowtie생물정보학에서 [3]시퀀스 정렬 및 시퀀스 분석에 일반적으로 사용되는 소프트웨어 패키지입니다.패키지의 소스 코드는 자유롭게 배포되며 컴파일된 이진 파일은 Linux, macOSWindows 플랫폼에서 사용할 수 있습니다.2017년 현재, 보타이 원법을 설명하는 게놈 생물학 논문은 11,000회 [3]이상 인용되었다.Bowtie는 오픈 소스 소프트웨어이며 현재 존스 홉킨스 대학에서 관리하고 있습니다.

역사

Bowtie 시퀀스 얼라이너는 2009년 [3]Maryland 대학의 Ben Langmead 등의해 처음 개발되었다.얼라이너는 일반적으로 짧은 판독치 및 큰 참조 게놈 또는 전체 게놈 분석에 사용됩니다.보타이는 "짧은 DNA 염기서열을 위한 초고속, 기억력 효율적인 쇼트 얼라이너"로 홍보된다.Bowtie의 속도 증가는 부분적으로 Burrows의 구현에 기인한다.얼라인먼트를 위한 휠러 트랜스폼으로 메모리 설치 공간(일반적으로 약 2.2) 절감인간 게놈의 경우 GB),[4] BWA[5]SOAP2[6] 정렬 방법에서도 유사한 방법이 사용됩니다.[4]

Bowtie는 가능한 정렬 공간을 통해 품질 인식, 탐욕, 무작위 깊이 우선 검색을 수행합니다.검색은 탐욕스럽기 때문에 Bowtie가 처음 접한 유효한 정렬이 불일치 수나 품질 면에서 반드시 '최고'일 필요는 없습니다.

Bowtie는 TopHat,[7] 커프링크[8] 및 CummeRbund Bioconductor [9]패키지를 포함한 많은 관련 바이오 정보 알고리즘에 의해 시퀀스 얼라이너로 사용됩니다.

보타이 2

2011년 10월 16일 개발자들은 Bowtie [10]2라는 프로젝트베타 포크를 출시했다.Bowtie 2는 Burrows-Wheeler 변환과 더불어 FM 인덱스(서픽스 배열과 유사)를 사용하여 메모리 공간을 작게 유지합니다.구현 덕분에 Bowtie 2는 기존 Bowtie 방식에 비해 더 길고 갭이 있는 정렬을 찾는 데 더 적합합니다.Bowtie 2에는 읽기 길이의 상한이 없으며 참조에서 애매한 문자를 정렬이 겹칠 수 있습니다.

레퍼런스

  1. ^ "Bowtie: An ultrafast, memory-efficient short read aligner". bowtie-bio.sourceforge.net. Retrieved 2021-03-28.
  2. ^ "Bowtie 2: fast and sensitive read alignment". bowtie-bio.sourceforge.net. Retrieved 2021-03-28.
  3. ^ a b c Langmead, Ben; Cole Trapnell; Mihai Pop; Steven L Salzberg (4 March 2009). "Ultrafast and memory-efficient alignment of short DNA sequences to the human genome" (PDF). Genome Biology. 10 (3): 10:R25. doi:10.1186/gb-2009-10-3-r25. PMC 2690996. PMID 19261174. Archived from the original (PDF) on 2012-10-20. Retrieved 29 November 2013.
  4. ^ a b "Bowtie: An ultrafast, memory-efficient short read aligner - SourceForge". Retrieved 29 November 2013.
  5. ^ Li, H.; Durbin, R. (18 May 2009). "Fast and accurate short read alignment with Burrows-Wheeler transform". Bioinformatics. 25 (14): 1754–1760. doi:10.1093/bioinformatics/btp324. PMC 2705234. PMID 19451168.
  6. ^ Li, R.; Yu, C.; Li, Y.; Lam, T.-W.; Yiu, S.-M.; Kristiansen, K.; Wang, J. (3 June 2009). "SOAP2: an improved ultrafast tool for short read alignment". Bioinformatics. 25 (15): 1966–1967. doi:10.1093/bioinformatics/btp336. PMID 19497933.
  7. ^ Trapnell, C.; Pachter, L.; Salzberg, S. L. (16 March 2009). "TopHat: discovering splice junctions with RNA-Seq". Bioinformatics. 25 (9): 1105–1111. doi:10.1093/bioinformatics/btp120. PMC 2672628. PMID 19289445.
  8. ^ "CummeRbund - An R package for persistent storage, analysis, and visualization of RNA-Seq from cufflinks output". Retrieved 11 August 2015.
  9. ^ Langmead, Ben; Salzberg, Steven L (4 March 2012). "Fast gapped-read alignment with Bowtie 2". Nature Methods. 9 (4): 357–359. doi:10.1038/nmeth.1923. PMC 3322381. PMID 22388286.

외부 링크