바이오컨덕터

Bioconductor
바이오컨덕터
Bioconductor logo.svg
안정된 릴리스
3.15 / 2022년 4월 27일; 3개월 전(2022-04-27)
운영 체제Linux, macOS, Windows
플랫폼R 프로그래밍 언어
유형생물정보학
면허증.Artistic License 2.0
웹 사이트www.bioconductor.org

바이오컨덕터분자생물학습식실험에서 생성게놈 데이터의 분석과 이해를 위한 자유롭고 오픈 소스 및 오픈 개발 소프트웨어 프로젝트입니다.

바이오컨덕터는 주로 통계 R 프로그래밍 언어에 기초하고 있지만 다른 프로그래밍 언어에 대한 기여가 포함되어 있습니다.매년 R의 반기 릴리즈에 이은2개의 릴리즈가 있습니다.R의 릴리스 버전에 대응하는 릴리스 버전과 R의 개발 버전에 대응하는 개발 버전이 있는 경우가 있습니다.대부분의 사용자는 릴리스 버전이 자신의 요구에 적합하다고 생각합니다.또한 주로 다른 유형의 마이크로어레이를 지향하는 많은 게놈 주석 패키지가 있다.

생물학적 데이터를 해석하기 위한 계산 방법이 계속 개발되고 있는 반면, 바이오컨덕터 프로젝트는 R 프로그래밍 환경에서 개발된 광범위한 통계 도구를 호스팅하는 오픈 소스 소프트웨어 저장소입니다.R의 풍부한 통계 기능과 그래픽 기능을 활용하여 다양한 데이터 분석 요구를 충족시키기 위해 많은 바이오컨덕터 패키지가 개발되었습니다.이러한 패키지를 사용하면 R 프로그래밍/명령어를 기본적으로 이해할 수 있습니다.그 결과, 강력한 컴퓨팅 배경을 가진 R 및 바이오컨덕터 패키지는 대부분의 생물학자들이 사용하고 있으며, 대부분의 생물학자들은 데이터셋 분석 능력을 통해 상당한 이점을 얻을 수 있습니다.이 모든 결과를 통해 생물학자들은 프로그래밍 전문지식을 필요로 하지 않고 게놈 데이터 분석에 쉽게 접근할 수 있습니다.

이 프로젝트는 2001년 가을에 시작되었으며, 주로 프레드 허친슨연구 센터를 거점으로 하는 바이오컨덕터 핵심 팀에 의해 감독되고 있으며, 다른 멤버들은 국제 기관에서 왔다.

패키지

대부분의 바이오컨덕터 컴포넌트는 R용 애드온 모듈인 R 패키지로 배포됩니다.처음에 대부분의 바이오컨덕터 소프트웨어 패키지는 단일 채널 Affymetrix 및 두 개 이상의 채널 cDNA/Oligo 마이크로 어레이 분석에 초점을 맞췄습니다.프로젝트가 성숙함에 따라 소프트웨어 패키지의 기능 범위는 SAGE, 시퀀스, SNP 데이터 등 모든 유형의 게놈 데이터 분석을 포함하도록 확장되었습니다.

목표들

프로젝트의 큰 목표는 다음과 같습니다.

  • 게놈 데이터 분석을 위한 광범위한 강력한 통계그래픽 방법에 대한 광범위한 액세스를 제공합니다.
  • 유전체 데이터 분석에 생물학적 메타데이터의 포함을 촉진한다(예: PubMed의 문헌 데이터, LocusLink/Entrez의 주석 데이터).
  • 플러그 가능, 확장성 및 상호 운용성이 뛰어난 소프트웨어를 신속하게 개발 도입할 수 있는 공통 소프트웨어 플랫폼을 제공합니다.
  • 고품질의 문서 작성과 재현 가능한 연구를 통해 과학적 이해도를 높입니다.
  • 게놈 데이터 분석을 위한 계산 및 통계 방법에 대한 연구자를 교육합니다.

주요 기능

  • 문서화와 재현 가능한 연구.각 바이오컨덕터 패키지에는 패키지 기능에 대한 텍스트적이고 작업 지향적인 설명을 제공하는 문서인 Vignette가 하나 이상 포함되어 있습니다.이 vignet은 여러 가지 형태로 제공됩니다.많은 경우 패키지의 소프트웨어를 사용하여 특정 작업을 수행하는 방법을 보여 주기 위해 설계된 단순한 "사용법"입니다.패키지에 대한 보다 자세한 개요를 제공하거나 패키지와 관련된 일반적인 문제를 논의하는 경우도 있습니다.향후 바이오컨덕터 프로젝트는 패키지에 특별히 얽매이지 않고 보다 복잡한 개념을 보여주는 Vignet을 제공하는 것을 목표로 하고 있습니다.바이오컨덕터 프로젝트의 모든 측면과 마찬가지로 사용자는 이 노력에 참여할 것을 권장합니다.
  • 통계적 방법 및 그래픽 방법.바이오컨덕터 프로젝트는 게놈 데이터 분석을 위한 광범위한 강력한 통계 및 그래픽 방법에 대한 접근을 제공하는 것을 목표로 한다.분석 패키지는 AffymetrixIllumina, cDNA 어레이 데이터 전처리, 차등 발현 유전자 식별, 그래프 이론 분석, 게놈 데이터 플롯팅에 사용할 수 있습니다.또한 R 패키지 시스템 자체는 선형 및 비선형 모델링, 클러스터 분석, 예측, 재샘플링, 생존 분석 및 시계열 분석을 포함한 다양한 최신 통계그래픽 기술을 구현합니다.
  • 게놈 주석바이오컨덕터 프로젝트는 GenBank, LocusLink 및 PubMed(주석 패키지)와 같은 웹 데이터베이스의 생물학적 메타데이터에 마이크로 어레이 및 기타 게놈 데이터를 실시간으로 연관짓는 소프트웨어를 제공합니다.또한 통계 분석 결과를 주석 WWW 리소스에 대한 링크와 함께 HTML 보고서에 통합하기 위한 기능도 제공됩니다.소프트웨어 도구는 GenBank, Gene Ontology Consortium, LocusLink, UniGene, UCSC Human Genome Project 등의 데이터베이스에서 AnnotationDbi 패키지로 게놈 데이터를 조립 및 처리하기 위해 사용할 수 있습니다.데이터 패키지는 서로 다른 프로브 식별자(예: Affy ID, LocusLink, PubMed) 간의 매핑을 제공하기 위해 배포됩니다.사용자 정의된 주석 라이브러리도 조립할 수 있습니다.
  • 오픈 소스바이오컨덕터 프로젝트는 SourceForge.net와 같은 플랫폼을 통해 배포하는 완전한 오픈 소스 규율을 위해 노력하고 있습니다.모든 기여는 Artistic 2.0, GPL2, BSD 오픈 소스 라이선스에 따라 존재할 것으로 예상됩니다.오픈 소스 소프트웨어가 마이크로 어레이 데이터 분석 및 일반적으로 계산 생물학에 도움이 되는 이유는 여러 가지가 있습니다.그 이유는 다음과 같습니다.
    • 알고리즘과 그 구현에 대한 완전한 접근을 제공한다.
    • 버그 수정 및 플러그인통한 소프트웨어 개선 촉진
    • 적절한 도구와 지침을 제공하여 과학적 컴퓨팅과 통계적 실천을 장려한다.
    • 연구자가 생물학적 데이터를 분석하는 데 사용되는 방법을 탐색하고 확장할 수 있는 도구의 워크벤치를 제공한다.
    • 연구 수행에 필요한 소프트웨어 도구의 소유자가 국제 과학 커뮤니티가 될 수 있도록 하기 위해
    • 성공적인 도구의 상업적 지원과 개발을 주도하고 장려한다.
    • 연구를 수행하기 위한 개방적이고 접근 가능한 도구를 제공함으로써 재생 가능한 연구를 촉진한다(재생 가능한 연구는 독립적인 검증과는 별개이다.
  • 오픈 디벨로프먼트사용자는 바이오컨덕터 준거 패키지 또는 문서를 작성하여 개발자가 될 것을 권장합니다.또, 바이오 컨덕터는, 공통의 목표를 가지는 다른 그룹을 서로 연결하기 위한 메카니즘을 제공하고 있습니다.이러한 메카니즘은, 소프트웨어에서의 공동 개발의 레벨에서도 가능합니다.

마일스톤

바이오컨덕터의 각 릴리스는 R의 [1]선택된 버전과 가장 잘 작동하도록 개발되었습니다.일반적으로 새로운 릴리스에서는 버그 수정 및 업데이트와 더불어 패키지가 추가됩니다.다음 표는 바이오컨덕터 릴리스를 R 버전에 매핑하고 해당 릴리스에서 사용 가능한 바이오컨덕터 소프트웨어 패키지 수를 보여 줍니다.

버전 발매일 패키지 수 R 의존성
3.15 2022년 4월 27일 2140 R 4.2
3.14 2021년 10월 27일 2083 R 4.1
3.11 2020년 4월 28일 1903 R 4.0
3.10 2019년 10월 30일 1823 R 3.6
3.8 2018년 10월 31일 1649 R 3.5
3.6 2017년 10월 31일 1473 R 3.4
3.4 2016년 10월 18일 1296 R 3.3
3.2 2015년 10월 14일 1104 R 3.2
3.0 2014년 10월 14일 934 R 3.1
2.13 2013년 10월 15일 749 R 3.0
2.11 2012년 10월 3일 610 R 2.15
2.9 2011년 11월 1일 517 R 2.14
2.8 2011년 4월 14일 466 R 2.13
2.7 2010년 11월 18일 418 R 2.12
2.6 2010년 4월 23일 389 R 2.11
2.5 2009년 10월 28일 352 R 2.10
2.4 2009년 4월 21일 320 R 2.9
2.3 2008년 10월 22일 294 R 2.8
2.2 2008년 5월 1일 260 R 2.7
2.1 2007년 10월 8일 233 R 2.6
2.0 2007년 4월 26일 214 R 2.5
1.9 2006년 10월 4일 188 R 2.4
1.8 2006년 4월 27일 172 R 2.3
1.7 2005년 10월 14일 141 R 2.2
1.6 2005년 5월 18일 123 R 2.1
1.5 2004년 10월 25일 100 R 2.0
1.4 2004년 5월 17일 81 R 1.9
1.3 2003년 10월 30일 49 R 1.8
1.2 2003년 5월 29일 30 R 1.7
1.1 2002년 10월 19일 20 R 1.6
1.0 2002년 5월 1일 15 R 1.5

자원.

  • Gentleman, R.; Carey, V.; Huber, W.; Irizarry, R.; Dudoit, S. (2005). Bioinformatics and Computational Biology Solutions Using R and Bioconductor. Springer. ISBN 978-0-387-25146-2.
  • Gentleman, R. (2008). R Programming for Bioinformatics. Chapman & Hall/CRC. ISBN 978-1-4200-6367-7.
  • Hahne, F.; Huber, W.; Gentleman, R.; Falcon, S. (2008). Bioconductor Case Studies. Springer. ISBN 978-0-387-77239-4.
  • Gentleman, Robert C.; Carey, Vincent J.; Bates, Douglas M.; Bolstad, Ben; Dettling, Marcel; Dudoit, Sandrine; Ellis, Byron; Gautier, Laurent; Ge, Yongchao; Gentry, Jeff; Hornik, Kurt; Hothorn, Torsten; Huber, Wolfgang; Iacus, Stefano; Irizarry, Rafael; Leisch, Friedrich; Li, Cheng; Maechler, Martin; Rossini, Anthony J.; Sawitzki, Gunther; Smith, Colin; Smyth, Gordon; Tierney, Luke; Yang, Jean Y. H.; Zhang, Jianhua (2004). "Bioconductor: open software development for computational biology and bioinformatics". Genome Biology. 5 (10): R80. doi:10.1186/gb-2004-5-10-r80. PMC 545600. PMID 15461798.

「 」를 참조해 주세요.

레퍼런스


  1. ^ "Bioconductor – Release Announcements". bioconductor.org. Bioconductor. Retrieved 28 May 2019.

외부 링크