표현 시퀀스 태그

Expressed sequence tag

유전학에서 발현 배열 태그(EST)는 cDNA [1]배열의 짧은 하위 배열이다.EST는 유전자 전사를 식별하기 위해 사용될 수 있으며, 유전자 발견과 유전자 배열 [2]결정에 중요한 도구였다.EST의 식별은 급속히 진행되어 약 7420만 개의 EST를 현재 공공 데이터베이스에서 이용할 수 있다(: GenBank 2013년 1월 1일, 모든 종).EST 접근법은 주로 전체 게놈과 전사체 배열 및 메타제놈 배열 배열로 대체되었다.

EST는 복제된 cDNA의 원샷 시퀀싱에서 발생합니다.EST 생성에 사용되는 cDNA는 일반적으로 cDNA 라이브러리의 개별 클론입니다.결과물은 현재의 기술에 의해 길이가 약 500 - 800 뉴클레오티드로 제한되는 비교적 낮은 품질의 단편이다.이러한 클론은 mRNA에 상보적인 DNA로 구성되기 때문에 EST는 발현된 유전자의 일부를 나타냅니다.데이터베이스에서는 cDNA/mRNA 시퀀스 또는 템플릿 가닥인 mRNA의 역보완으로 나타낼 수 있습니다.

방사선 하이브리드 매핑, 해피 맵핑, FISH 물리적 매핑 기술을 사용하여 EST를 특정 염색체 위치에 매핑할 수 있습니다. 또한 EST를 생성한 유기체의 게놈이 염기서열이 분석된 경우에는 컴퓨터를 사용하여 EST 염기서열을 해당 게놈에 맞출 수 있습니다.

인간 유전자 세트의 현재 이해(2006년 기준)는 EST 증거만을 바탕으로 수천 개의 유전자의 존재를 포함한다.이 점에서 EST는 이들 유전자의 예측된 전사물을 정제하는 도구가 되어 단백질 생성물의 예측과 궁극적으로는 그 기능의 예측으로 이어지고 있다.또한 그러한 EST가 획득되는 상황(조직, 장기, 질병 상태 - 예를 들어 암)은 해당 유전자가 작용하고 있는 조건에 대한 정보를 제공한다.EST는 유전자 발현 프로파일을 결정하기 위해 사용될 수 있는 DNA 마이크로어레이를 위한 정밀한 탐침의 설계를 허용하기에 충분한 정보를 포함하고 있다.

일부 저자들은 태그 [3]외에 더 이상의 정보가 거의 또는 전혀 존재하지 않는 유전자를 설명하기 위해 "EST"라는 용어를 사용한다.

역사

1979년 하버드와 칼텍 팀은 mRNA의 DNA 복사를 체외로 만드는 기본 아이디어를 박테리아 플라스미드에 [4]있는 그러한 라이브러리로 확장했습니다.

1982년 Greg Sutcliffe와 [5]동료들은 이러한 cDNA 라이브러리에서 랜덤 또는 반랜덤 클론을 선택하여 시퀀싱을 수행하는 아이디어를 연구했습니다.

1983년 Putney et al.는 토끼 근육 cDNA [6]라이브러리에서 178개의 클론의 염기서열을 분석했습니다.

1991년 애덤스와 동료들은 EST라는 용어를 만들고 프로젝트로서 보다 체계적인 시퀀싱을 시작했습니다(600개의 [2]뇌 cDNA에서 시작).

데이터 및 주석 소스

DBEST

dbEST는 1992년에 설립된 Genbank의 부문이다.GenBank의 경우 dbEST의 데이터는 전 세계 연구소에서 직접 제출되며 큐레이션되지 않습니다.

EST 콘티그먼트

EST가 배열되는 방식 때문에, 많은 구별되는 발현 배열 태그는 종종 유기체의 동일한 mRNA에 대응하는 부분 배열이다.하류 유전자 발견 분석을 위한 발현 배열 태그의 수를 줄이기 위해 여러 그룹이 발현 배열 태그를 EST 콘티그에 조립했다.EST 콘티지트를 제공하는 리소스의 예는 다음과 같습니다.TIGR 유전자 지수,[7] 유니겐 [8]및 STACK

EST 콘티지를 구성하는 것은 단순하지 않고 인공물(두 개의 다른 유전자 생성물을 포함하는 콘티지)을 생산할 수 있다.유기체의 완전한 게놈 배열을 이용할 수 있고, 전사물에 주석을 달면, 전사물을 EST와 직접 대조하는 것이 가능하다.이 접근법은 TissueInfo 시스템(아래 참조)에서 사용되며 게놈 데이터베이스의 주석을 EST 데이터에 의해 제공되는 조직 정보에 쉽게 연결할 수 있습니다.

조직 정보

EST의 높은 throughput 분석에서도 유사한 데이터 관리 과제에 직면하는 경우가 많습니다.첫 번째 과제는 EST 라이브러리의 조직 출현이 dbEST에서 [10]쉬운 영어로 기술된다는 것입니다.따라서 두 EST 라이브러리가 동일한 조직으로부터 시퀀싱되었다고 명확하게 판단할 수 있는 프로그램을 작성하기가 어렵습니다.마찬가지로 조직에 대한 질병 조건은 계산 친화적인 방식으로 주석을 달지 않는다.예를 들어, 라이브러리의 암 기원은 종종 조직 이름과 혼합된다(예: 조직 이름 "교아종"은 EST 라이브러리가 뇌 조직으로부터 배열되었고 질병 상태가 [11]암임을 나타낸다).암을 제외하고 질병 상태는 종종 dbEST 항목에 기록되지 않습니다.TissueInfo 프로젝트는 이러한 과제를 해결하기 위해 2000년에 시작되었습니다.이 프로젝트는 조직 기원과 질병 상태(암/비암)를 명확히 하기 위해 큐레이션된 데이터(매일 업데이트됨)를 제공하고, 조직과 장기를 "일부" 관계에 의해 연결하는 조직 온톨로지(즉 시상하부가 뇌의 일부이고, 뇌가 중추신경계의 일부라는 지식을 공식화함)를 제공하며, 오픈 소스를 배포한다.배열된 게놈의 [12]전사 주석을 dbEST의 데이터로 계산된 조직 발현 프로필과 연결하기 위한 소프트웨어입니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ EST 팩트 시트국립생명공학정보센터
  2. ^ a b Adams MD, Kelley JM, Gocayne JD, et al. (Jun 1991). "Complementary DNA sequencing: expressed sequence tags and human genome project". Science. 252 (5013): 1651–6. Bibcode:1991Sci...252.1651A. doi:10.1126/science.2047873. PMID 2047873. S2CID 13436211.
  3. ^ DBEST
  4. ^ Sim GK, Kafatos FC, Jones CW, Koehler MD, Efstratiadis A, Maniatis T (December 1979). "Use of a cDNA library for studies on evolution and developmental expression of the chorion multigene families". Cell. 18 (4): 1303–16. doi:10.1016/0092-8674(79)90241-1. PMID 519770.
  5. ^ Sutcliffe JG, Milner RJ, Bloom FE, Lerner RA (August 1982). "Common 82-nucleotide sequence unique to brain RNA". Proc Natl Acad Sci U S A. 79 (16): 4942–6. Bibcode:1982PNAS...79.4942S. doi:10.1073/pnas.79.16.4942. PMC 346801. PMID 6956902.
  6. ^ Putney SD, Herlihy WC, Schimmel P (1983). "A new troponin T and cDNA clones for 13 different muscle proteins, found by shotgun sequencing". Nature. 302 (5910): 718–21. Bibcode:1983Natur.302..718P. doi:10.1038/302718a0. PMID 6687628. S2CID 4364361.
  7. ^ Lee Y, Tsai J, Sunkara S, et al. (Jan 2005). "The TIGR Gene Indices: clustering and assembling EST and known genes and integration with eukaryotic genomes". Nucleic Acids Res. 33 (Database issue): D71–4. doi:10.1093/nar/gki064. PMC 540018. PMID 15608288.
  8. ^ Stanton JA, Macgregor AB, Green DP (2003). "Identifying tissue-enriched gene expression in mouse tissues using the NIH UniGene database". Appl Bioinform. 2 (3 Suppl): S65–73. PMID 15130819.
  9. ^ Christoffels A, van Gelder A, Greyling G, Miller R, Hide T, Hide W (Jan 2001). "STACK: Sequence Tag Alignment and Consensus Knowledgebase". Nucleic Acids Res. 29 (1): 234–8. doi:10.1093/nar/29.1.234. PMC 29830. PMID 11125101.
  10. ^ Skrabanek L, Campagne F (Nov 2001). "TissueInfo: high-throughput identification of tissue expression profiles and specificity". Nucleic Acids Res. 29 (21): E102–2. doi:10.1093/nar/29.21.e102. PMC 60201. PMID 11691939.
  11. ^ Campagne F, Skrabanek L (2006). "Mining expressed sequence tags identifies cancer markers of clinical interest". BMC Bioinformatics. 7: 481. doi:10.1186/1471-2105-7-481. PMC 1635568. PMID 17078886.
  12. ^ :컴퓨터의 생물의학:: TissueInfo 2008년6월 4일 Wayback Machine에서 아카이브 완료

외부 링크

티슈 정보