국립생명공학정보센터

National Center for Biotechnology Information
국립 센터
생명공학 정보
US-NLM-NCBI-Logo.svg
약어엔씨비
설립됨1988; 34년 전 (1998년)
본부메릴랜드베데스다
위치
좌표38°59′45″N 77°05′56″w/38.9959°N 77.0989°W/ 38.9959; -77.0989좌표: 38°59′45″N 77°05′56″W / 38.9959°N 77.0989°W / 38.9959;; -77.0989
공용어
영어
감독
제임스 오스텔
(2017년 9월 11일 이후)
모조직
미국 국립 의학 도서관
소속국립보건원
웹사이트ncbi.nlm.nih.gov

국립생명공학정보센터(NCBI)[1][2]미국 국립의료원(National Institute of Health, NIH)의 분관인 미국 국립 의학도서관(National Library of Medicine, NLM)의 일부다.그것은 미국 정부의 승인과 자금후원을 받는다.NCBI는 메릴랜드 베데스다에 위치해 있으며 1988년 미국 하원의원 클로드 페퍼의 후원을 받아 제정됐다.

NCBI는 생명공학바이오의학과 관련된 일련의 데이터베이스를 보유하고 있으며 생명정보학 도구와 서비스에 중요한 자원이다.주요 데이터베이스로는 DNA 서열을 위한 GenBank와 생물 의학 문헌을 위한 서지학 데이터베이스인 PubMed가 있다.다른 데이터베이스는 NCBI Epigenomics 데이터베이스를 포함한다.이 모든 데이터베이스는 엔트레즈 검색엔진을 통해 온라인으로 이용할 수 있다.NCBI는 블라스트 시퀀스 정렬 프로그램의[3] 원작자 중 한 사람이자 생명정보학 분야에서 널리 존경받는 인물인 데이비드 립먼이 감독을 맡았다.[2]

젠뱅크

NCBI는 1992년부터 GenBank DNA 시퀀스 데이터베이스를 사용할 수 있도록 하는 책임을 지고 있었다.[4]GenBank는 유럽 분자생물학연구소(EMBL) 및 일본 DNA 데이터 뱅크(DDBJ)와 같은 개별 실험실 및 기타 시퀀스 데이터베이스와 협력한다.[4]

1992년부터 NCBI는 GenBank 외에 다른 데이터베이스도 제공하도록 성장했다.NCBI는 Gene, Online Mendelian in Man, Molecular Modeling Database(3D 단백질 구조), dbSNP(3D nucleotide polymorism), 참조순서 수집, 인간 게놈 지도, 분류법 브라우저를 제공하며 국립암연구소와 조율하여 암 게놈해부학 프로제(Projec)를 제공한다.t. NCBI는 유기체의 각 종에 고유한 식별자(분류 ID 번호)를 할당한다.[5]

NCBI는 인터넷 브라우저나 FTP를 통해 이용할 수 있는 소프트웨어 도구를 가지고 있다.예를 들어, 블라스트는 시퀀스 유사성 검색 프로그램이다.블라스트는 15초 이내에 GenBank DNA 데이터베이스와 시퀀스 비교를 할 수 있다.

엔씨비 북셀프

NCBI 북셀프는[6] 자유롭게 접근 가능하고 다운로드 가능한 온라인 버전의 선별된 생물의학 서적 모음집이다.북셀프는 분자생물학, 생화학, 세포생물학, 유전학, 미생물학, 분자와 세포의 관점에서 본 질병 상태, 연구방법, 바이러스학 등 광범위한 주제를 다룬다.책 중 일부는 이전에 출판된 책들의 온라인 버전이고, 커피 브레이크와 같은 다른 책들은 NCBI 직원이 쓰고 편집한다.북셀프(Bookshelf)는 북셀프(Bookshelf) 콘텐츠가 진화하는 연구 영역에 대한 확립된 관점과 보고된 연구의 이질적인 개별적인 많은 부분을 구성할 수 있는 맥락을 제공한다는 점에서 동료 검토 출판 추상화의 Entres PubMed 저장소의 보완물이다.[citation needed]

기본 로컬 정렬 검색 도구(BLAST)

블라스트DNA의 뉴클레오티드 시퀀스와 단백질의 아미노산 시퀀스 등 생물학적 시퀀스 사이의 시퀀스 유사성을 계산하는 데 사용되는 알고리즘이다.[7]블라스트는 동일한 유기체 내에서 또는 다른 유기체 내에서 질의 순서와 유사한 시퀀스를 찾는 강력한 도구다.그것은 NCBI 데이터베이스와 서버에서 조회 순서를 검색하고 그 결과를 선택한 형식으로 사용자의 브라우저에 다시 게시한다.블라스트에 대한 입력 시퀀스는 대부분 FASTA 또는 Genbank 형식이며 출력은 HTML, XML 형식 및 일반 텍스트와 같은 다양한 형식으로 제공될 수 있다.HTML은 NCBI 웹 페이지의 기본 출력 형식이다.NCBI-BLAST에 대한 결과는 발견된 모든 히트, 점수 관련 데이터가 포함된 히트 시퀀스 식별자 표, 관심 순서에 대한 정렬, 관심사와[8] 유사한 블라스트 점수로 받은 히트 등을 그래픽 형식으로 표시한다.

엔트레스

엔트레즈 글로벌 쿼리 크로스 데이터베이스 검색 시스템은 NCBI에서 뉴클레오티드 및 단백질 시퀀스, 단백질 구조, PubMed, 택소노미, 완전한 게놈, OMIM 등 모든 주요 데이터베이스에 사용된다.[9]엔트레즈는 생물 의학 연구를 위한 다양한 출처의 데이터를 가진 지수화 및 검색 시스템이다.NCBI는 1991년 PDBGenBank의 뉴클레오티드 시퀀스, 스위스-PROT의 단백질 시퀀스, 번역된 GenBank, PIR, PRF, PDB, PubMed의 관련 추상화 및 인용문으로 구성된 엔트레즈의 첫 번째 버전을 배포했다.엔트레즈는 여러 소스, 데이터베이스 및 형식의 데이터를 통일된 정보 모델과 검색 시스템으로 통합하여 관련 참조, 순서 및 구조를 효율적으로 검색할 수 있도록 특별히 설계되었다.[10]

유전자

진은 유전자에 대한 정보를 특성화하고 정리하기 위해 NCBI에서 시행되었다.게놈 지도, 표현, 순서, 단백질 함수, 구조, 호몰로지 데이터의 넥서스에서 주요 노드 역할을 한다.유니크 진ID는 수정 주기를 통해 추적할 수 있는 각 유전자 기록에 할당된다.알려져 있거나 예측된 유전자에 대한 유전자 기록은 여기서 확립되며 지도 위치나 뉴클레오티드 순서에 따라 구분된다.진은 NCBI의 다른 데이터베이스와의 더 나은 통합, 더 넓은 분류학 범위, 엔트레스 시스템이 제공하는 질의와 검색에 대한 향상된 옵션을 포함하여, 전임자인 로쿠스링크에 비해 몇 가지 장점을 가지고 있다.[11]

단백질

단백질 데이터베이스는 NCBI 레퍼런스 시퀀스(RefSeq) 프로젝트, GenBank, PDB, UniProtKB/SWISS-Prot 등 다양한 리소스에서 파생된 개별 단백질 시퀀스에 대한 텍스트 레코드를 유지한다.단백질 기록은 FASTA와 XML을 포함한 다른 형식으로 존재하며 다른 NCBI 자원과 연결된다.단백질은 유전자, DNA/RNA 시퀀스, 생물학적 경로, 표현 및 변동 데이터, 문헌과 같은 관련 데이터를 사용자에게 제공한다.그것은 또한 블라스트에 의해 계산된 것과 같이 각 시퀀스에 대해 유사하고 동일한 단백질의 사전 결정된 세트를 제공한다.NCBI의 Structure 데이터베이스는 NCBI가 가져온 PDB에서 실험적으로 결정된 구조물에 대한 3D 좌표 세트를 포함하고 있다.단백질의 보존 도메인 데이터베이스(CDD)는 단백질 시퀀스 내에서 보존도가 높은 도메인을 특징짓는 시퀀스 프로파일을 포함한다.SMART, Pfam 등 외부 자원의 기록도 보유하고 있다.단백질 클러스터 데이터베이스라고 알려진 단백질에는 또 다른 데이터베이스가 있는데, 이 데이터베이스는 블라스트에 의해 계산된 개별 시퀀스 사이의 최대 정렬에 따라 군집화된 단백질 시퀀스 집합을 포함하고 있다.[12]

Pubchem 데이터베이스

NCBI의 PubChem 데이터베이스는 분자와 분자의 생물학적 검사에 대한 활동을 위한 공공 자원이다.펍켐은 엔트레즈 정보 검색 시스템으로 검색 가능하고 접근 가능하다.[13]

참고 항목

참조

  1. ^ "The Human Genome Project". The New York Times.
  2. ^ a b "Research Institute Posts Gene Data on Internet". The New York Times. June 26, 1997.
  3. ^ "Sense from Sequences: Stephen F. Altschul on Bettering BLAST". 2000. Archived from the original on 2007-10-07.
  4. ^ a b Mizrachi, Ilene (22 August 2007). GenBank: The Nucleotide Sequence Database. National Center for Biotechnology Information (US) – via www.ncbi.nlm.nih.gov.
  5. ^ "Home - Taxonomy - NCBI". www.ncbi.nlm.nih.gov.
  6. ^ USA (2019-05-06). "Home - Books - NCBI". Ncbi.nlm.nih.gov. Retrieved 2019-06-12.
  7. ^ Altschul Stephen; Gish Warren; Miller Webb; Myers Eugene; Lipman David (1990). "Basic local alignment search tool". Journal of Molecular Biology. 215 (3): 403–410. doi:10.1016/s0022-2836(05)80360-2. PMID 2231712.
  8. ^ 매든 T. (2002)NCBI 핸드북, 2판, 16장, 블라스트 시퀀스 분석 도구
  9. ^ NCBI 리소스 코디네이터(2012년)."National Center for Biology Information"의 데이터베이스 리소스.핵산 연구 41(데이터베이스 문제):D8–D20.
  10. ^ 오스텔 J. (2002년).NCBI 핸드북, 제2판, 제15장 엔트레즈 검색 및 검색 시스템
  11. ^ 매글롯 D, 프루이트 K. & 타토바 T. (2005)NCBI 핸드북, 제2판, 제19장 유전자: 유전자의 디렉토리
  12. ^ 세이어스 E. (2013).NCBI 핸드북, 제2판 NCBI 단백질 자원
  13. ^ Wang Y. & Bryant S. H. (2014).NCBI 핸드북, 제2판, NCBI PubChem BioAssay 데이터베이스

외부 링크