일반 모델 유기체 데이터베이스

Generic Model Organism Database
GMOD(Generic Model Organism Database)
운영체제윈도우, 맥 OS X
유형생물정보학
면허증.GPL v3
웹사이트gmod.org/wiki/Main_Page Edit this on Wikidata

GMOD(Generic Model Organism Database) 프로젝트는 생물학 연구 커뮤니티에 생물학적 데이터를 시각화, 주석, 관리 및 저장하기 위한 오픈 소스 소프트웨어 구성 요소의 툴킷을 제공합니다. GMOD 프로젝트는 미국 국립 보건원, 국립 과학 재단USDA 농업 연구 서비스의 자금 지원을 받고 있습니다.

역사

GMOD 프로젝트는 시퀀싱 프로젝트의 데이터를 처리하기 위한 유사한 소프트웨어 도구를 만들어야 한다는 필요성을 공유한 여러 모델 유기체 데이터베이스(MOD) 간의 협력으로 2000년대 초에 시작되었습니다. MOD 또는 유기체별 데이터베이스는 생명과학에서 중요한 실험 유기체에 대한 게놈 및 기타 정보를 설명하고 현대 생물학에 의해 생성되고 있는 대량의 데이터 및 정보를 캡처합니다. FlyBase, Saccharomyces Genome Database, Mouse Genome Database, WormBase 등 4개의 주요 MOD가 협력하여 MOD 내의 데이터를 관리하는 데 도움이 되는 소프트웨어와 같이 모든 MOD가 필요로 하는 기능을 제공하고 사용자가 데이터에 액세스하고 쿼리할 수 있도록 지원하는 애플리케이션을 만들었습니다.

GMOD 프로젝트는 소프트웨어 구성 요소를 상호 운용할 수 있도록 유지합니다. 이를 위해 많은 툴이 공통 입출력 파일 형식을 사용하거나 Chado 스키마 데이터베이스를 실행합니다.

Chado 데이터베이스 스키마

Chado[1] 스키마는 유전자 데이터부터 계통수, 출판물, 유기체, 마이크로어레이 데이터, ID, RNA/단백질 발현에 이르기까지 현대 생물학자들이 자주 사용하는 많은 종류의 데이터를 다루는 것을 목표로 합니다. Chado는 데이터베이스의 모든 엔티티를 입력하기 위해 제어된 어휘를 광범위하게 사용합니다. 예를 들어 유전자, 전사체, 엑손, 전위 요소 등은 Sequence Ontology에서 제공하는 유형으로 특징 테이블에 저장됩니다. 새 유형이 Sequence Ontology에 추가되면 피쳐 테이블은 수정할 필요가 없으며 데이터베이스의 데이터만 업데이트합니다. 차도에 저장할 수 있는 분석 자료도 대체로 마찬가지입니다.

차도의 기존 핵심 모듈은 다음과 같습니다.

  • sequence - sequence에 대하여/
  • cv - 통제된 vocabs/온톨로지의 경우
  • 일반 - 현재 그냥 dbxrefs
  • 유기체 - 분류학적 데이터
  • 펍 - 출판물 및 참고문헌
  • companalysis - 컴퓨터 분석 데이터를 사용하여 시퀀스 모듈을 증강합니다.
  • 맵 - 비시퀀스 맵
  • 유전자-유전자 및 표현형 데이터
  • 발현 - 유전자 발현
  • 자연 다양성 - 모집단 데이터

소프트웨어

GMOD 소프트웨어 구성 요소의 전체 목록은 GMOD 구성 요소 페이지에서 확인할 수 있습니다.[2] 이러한 구성 요소는 다음과 같습니다.

  • GMOD Core(Chado 데이터베이스 및 도구)
    • Chado : Chado 스키마와 그것을 설치하기 위한 도구.[3]
    • XORT: chado-xml을[4] 로딩하고 덤핑하기 위한 도구
    • GMODTools: Chado 데이터베이스에서 공통 게놈 벌크 형식(GFF, Fasta 등)으로 데이터를 추출합니다.[5]
  • MOD 웹사이트
    • 트라이팔: 드루팔을 기반으로 한 웹 프론트 엔드.[6]
  • 게놈 편집 및 시각화
    • 아폴로: 게놈 주석[7][8] 보기 및 편집을 위한 자바 애플리케이션
    • GBrowse: 게놈 주석을[9][10] 표시하기 위한 CGI 응용 프로그램
    • JBrowse: 게놈 주석을[11] 표시하기 위한 자바스크립트 응용 프로그램
    • Pathway Tools: 비교 모드가 있는 genome 브라우저
  • 비교유전체학
    • GBrowse_syn: GBrowse 기반 합성 뷰어[12]
    • CMAP: 비교 지도를[13] 표시하기 위한 CGI 어플리케이션
  • 문헌 큐레이션
    • Textpresso : 과학 문헌 텍스트 마이닝 시스템
  • 데이터베이스 조회 도구
    • 바이오마트 : 질의 중심의 데이터 관리 시스템
    • InterMine: 오픈 소스 데이터 웨어하우스 시스템
  • 생물학적 경로
    • 경로 도구: 대사 경로 정보 및 고처리량 기능 유전체 데이터 분석을 위한 도구
  • 규제 네트워크
    • Pathway Tools: 규제 상호 작용 정의 및 규제 네트워크 탐색 지원
  • 분석.

Galaxy

참여 데이터베이스

다음 유기체 데이터베이스는 모델 유기체 데이터베이스를 위한 GMOD 구성 요소에 기여 및/또는 채택하고 있습니다.

나이세드[17] 안토노스포라DB[citation needed] 애기장대[18]
비베이스 비틀베이스[19][20] 소 유전체 데이터베이스(BGD)
바이오헬스베이스[21] 소 QTL 뷰어 Cattle EST 유전자 패밀리 데이터베이스
CGD CGL 크롬DB
염색체 7번 주석 프로젝트 CSHLmpd 게놈 변이체 데이터베이스
딕티베이스[22] 드로스페지 에코사이클
플라이베이스 곰팡이 비교유전체학 곰팡이 텔로미어 브라우저
갤러스 게놈 브라우저 유전자DB 곡물 유전자
그라민 합맵 인간 2q33
인간 게놈 분절 복제 데이터베이스 IVDB MAGI
해양생물실험실 생물 데이터베이스 마우스 게놈 정보학 비인간 분절 복제 데이터베이스
OMAP OryGenesDB 오리자 염색체 8
경로 도구 파라메슘DB[23] 피넛맵
플랜츠DB 플라스모DB 폼베이스
의사 CAP 포섬 베이스 PUMAdb
쥐 게놈 데이터베이스 사카로미세스 유전체 데이터베이스 SGD 라이트
스메드DB 솔지노믹스 네트워크 소이베이스
대두 그브로스 데이터베이스 T1DBase 애기장대 정보 자원
TGD 게놈 연구소 게놈연구소
TIGR 쌀 유전체 브라우저 ToxoDB TriAnnot BAC 뷰어
벡터베이스 wFleaBase[24] 웜베이스
잔투스 베이스 젠베이스

관련사업

참고 항목

참고문헌

  1. ^ Christopher J. Mungall; David B. Emmert; The FlyBase Consortium (2007). "A Chado case study: an ontology-based modular schema for representing genome-associated biological information". Bioinformatics. 23 (13): i337–i346. doi:10.1093/bioinformatics/btm189. PMID 17646315.
  2. ^ "GMOD Components - GMOD". gmod.org.
  3. ^ "Chado - Getting Started - GMOD". gmod.org.
  4. ^ "XORT - GMOD". gmod.org.
  5. ^ "GMODTools - GMOD". gmod.org.
  6. ^ "Tripal". gmod.org.
  7. ^ "Apollo - GMOD". gmod.org.
  8. ^ "Apollo — Apollo 2.7.0 documentation". genomearchitect.readthedocs.io.
  9. ^ "GBrowse - GMOD". gmod.org.
  10. ^ Stein LD; Mungall C; Shu S; Caudy M; Mangone M; Day A; Nickerson E; Stajich JE; Harris TW; Arva A; Lewis S. (2002). "The generic genome browser: a building block for a model organism system database". Genome Res. 12 (10): 1599–610. doi:10.1101/gr.403602. PMC 187535. PMID 12368253.
  11. ^ "JBrowse - GMOD". gmod.org.
  12. ^ "GBrowse syn - GMOD". gmod.org.
  13. ^ "CMap - GMOD". gmod.org.
  14. ^ "Textpresso". gmod.org.
  15. ^ Afgan, E.; Baker, D.; van den Beek, M.; Blankenberg, D.; Bouvier, D.; Čech, M.; Chilton, J.; Clements, D.; Coraor, N.; Eberhard, C.; Grüning, B.; Guerler, A.; Hillman-Jackson, J.; Von Kuster, G.; Rasche, E.; Soranzo, N.; Turaga, N.; Taylor, J.; Nekrutenko, A.; Goecks, J. (8 July 2016). "The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update". Nucleic Acids Research. 44 (W1): W3–W10. doi:10.1093/nar/gkw343. PMC 4987906. PMID 27137889.
  16. ^ Cantarel, Brandi L.; Korf, Ian; Robb, Sofia M. C.; Parra, Genis; Ross, Eric; Moore, Barry; Holt, Carson; Sánchez Alvarado, Alejandro; Yandell, Mark (January 2008). "MAKER: an easy-to-use annotation pipeline designed for emerging model organism genomes". Genome Research. pp. 188–196. doi:10.1101/gr.6743907.
  17. ^ Tassy, Olivier; Dauga, Delphine; Daian, Fabrice; Sobral, Daniel; Robin, François; Khoueiry, Pierre; Salgado, David; Fox, Vanessa; Caillol, Danièle; Schiappa, Renaud; Laporte, Baptiste; Rios, Anne; Luxardi, Guillaume; Kusakabe, Takehiro; Joly, Jean-Stéphane; Darras, Sébastien; Christiaen, Lionel; Contensin, Magali; Auger, Hélène; Lamy, Clément; Hudson, Clare; Rothbächer, Ute; Gilchrist, Michael J.; Makabe, Kazuhiro W.; Hotta, Kohji; Fujiwara, Shigeki; Satoh, Nori; Satou, Yutaka; Lemaire, Patrick (1 October 2010). "The ANISEED database: Digital representation, formalization, and elucidation of a chordate developmental program". Genome Research. 20 (10): 1459–1468. doi:10.1101/gr.108175.110. ISSN 1088-9051.
  18. ^ Weems, Danforth; Miller, Neil; Garcia-Hernandez, Margarita; Huala, Eva; Rhee, Seung Y. (2004). "Design, Implementation and Maintenance of a Model Organism Database for Arabidopsis thaliana". Comparative and Functional Genomics. 5 (4): 362–369. doi:10.1002/cfg.408. ISSN 1531-6912.
  19. ^ Wang L; Wang S; Li Y; Paradesi MS; Brown SJ. (2007). "BeetleBase: the model organism database for Tribolium castaneum". Nucleic Acids Res. 35 (Database issue): D476–9. doi:10.1093/nar/gkl776. PMC 1669707. PMID 17090595.
  20. ^ "BeetleBase". www.bioinformatics.ksu.edu/Be. Archived from the original on 13 July 2006.
  21. ^ Noronha, Antonio; Cui, Changhai; Harris, Robert Adron; Crabbe, John C. (2014). Neurobiology of Alcohol Dependence. Elsevier. ISBN 978-0-12-407155-1.
  22. ^ Chisholm RL; Gaudet P; Just EM; Pilcher KE; Fey P; Merchant SN; Kibbe WA. (2006). "dictyBase, the model organism database for Dictyostelium discoideum". Nucleic Acids Res. 34 (Database issue): D423–7. doi:10.1093/nar/gkj090. PMC 1347453. PMID 16381903.
  23. ^ Arnaiz O; Cain S; Cohen J; Sperling L. (2007). "ParameciumDB: a community resource that integrates the Paramecium tetraurelia genome sequence with genetic data". Nucleic Acids Res. 35 (Database issue): D439–44. doi:10.1093/nar/gkl777. PMC 1669747. PMID 17142227.
  24. ^ Colbourne JK; Singan VR; Gilbert DG. (2005). "wFleaBase: the Daphnia genome database". BMC Bioinformatics. 6: 45. doi:10.1186/1471-2105-6-45. PMC 555599. PMID 15752432.

외부 링크