CASP

CASP
타깃 구조(리본) 및 354개의 템플릿 기반 예측 중첩(회색 Calpha backbone), CASP8에서

단백질 구조 예측비판적 평가(CASP)는 1994년부터 [1]2년마다 실시되고 있는 단백질 구조 예측을 위한 지역사회 차원의 세계적인 실험입니다.CASP는 연구 그룹에 구조 예측 방법을 객관적으로 테스트할 수 있는 기회를 제공하고 연구 커뮤니티와 소프트웨어 사용자에게 단백질 구조 모델링의 최첨단 기술을 독립적으로 평가합니다.CASP의 주요 목표는 단백질의 3차원 구조를 아미노산 배열에서 식별하는 방법을 발전시키는 것이지만, 많은 사람들은 이 실험을 이 과학 분야에서 "세계 챔피언"으로 더 많이 보고 있다.전 세계에서 100개 이상의 연구 그룹이 정기적으로 CASP에 참여하고 있으며, 실험 준비와 상세한 예측 실행에 주력하는 동안 그룹 전체가 다른 연구를 수개월 동안 중단하는 것은 드문 일이 아닙니다.

표적단백질 선택

어떤 예측 변수도 단백질 구조에 대한 사전 정보를 얻을 수 없도록 이중 블라인드 방식으로 실험을 수행하는 것이 중요합니다.예측 변수, 주최자 및 평가자 모두 예측이 이루어지는 시점에 표적 단백질의 구조를 알지 못한다.구조 예측의 대상은 X선 결정학 또는 NMR 분광학으로 곧 해결될 구조 또는 (주로 구조 유전체학 센터 중 하나에 의해) 이제 막 해결되어 단백질 데이터 뱅크에 의해 보류된 구조이다.주어진 배열이 알려진 구조의 단백질 배열(템플릿이라고 함)에 공통적으로 관련되는 것으로 판명되면 비교 단백질 모델링을 사용하여 3차 구조를 예측할 수 있다.템플릿은 배열 정렬 방법(: BLAST 또는 HHsearch) 또는 단백질 스레드 방법을 사용하여 찾을 수 있으며, 이는 멀리 관련 템플릿을 찾는 데 더 적합합니다.그렇지 않으면 de novo 단백질 구조 예측(예: Rosetta)을 적용해야 하며, 이는 훨씬 덜 신뢰할 수 있지만 때때로 정확한 접힘(일반적으로 100-150 아미노산 미만 단백질의 경우)으로 모델을 산출할 수 있다.정말로 새로운 접힘이 [2][3]대상들 사이에서 매우 드물어져서, 그 카테고리는 바람직하지 않게 되었다.

평가하기

주요 평가 방법은[4] 예측된 모델 α-탄소 위치와 대상 구조의 위치를 비교하는 것이다.비교는 그림에서와 같이 모델과 구조물의 정렬에서 등가물 α-탄소 쌍 사이의 거리 누적 플롯에 의해 시각적으로 나타나고(완벽한 모델은 끝까지 0에 머무른다), 웰-모드의 비율을 설명하는 수치 점수 GDT-TS(Global Distance Test-Total Score)가 할당된다.표적과 [5]관련하여 모델의 잔류물을 유도했습니다.숫자 점수가 가장 어려운 [6]경우에서 느슨한 유사성을 찾는 데 효과적이지 않기 때문에 무료 모델링(템플릿 프리 또는 de novo)도 평가자에 의해 시각적으로 평가된다.고정밀 템플릿 기반 예측은 [8]CASP7에서 대상 결정[7] 구조의 분자 치환 페이징에 효과가 있는지 여부와 후속 성공으로 CASP8의 [9]목표물에 대한 풀 모델(α-탄소뿐만 아니라)의 품질 및 풀 모델 매칭에 의해 평가되었다.

결과에 대한 평가는 다음과 같은 예측 범주로 수행됩니다.

  • 3차 구조 예측(모든 CASP)
  • 세컨더리 구조 예측(CASP5 이후 폐기)
  • 구조 복합체의 예측(CASP2만 해당; 개별 실험: CAPRI: 이 주제에 대한 전달)
  • 잔류-잔류 접촉 예측(CASP4 시작)
  • 무질서 영역 예측(CASP5 시작)
  • 도메인 경계 예측(CASP6-CASP8)
  • 함수 예측(CASP6 시작)
  • 모델 품질 평가(CASP7 시작)
  • 모델 개량(CASP7 시작)
  • 고정밀 템플릿 기반 예측(CASP7 시작)

3차 구조 예측 범주는 다음으로 세분되었다.

  • 호몰로지 모델링
  • 접힘 인식(단백질 스레딩이라고도 함. 스레딩이 방법이기 때문에 이 이름이 올바르지 않음을 주의)
  • 많은 방법들이 인공 신경망과 같은 토종 단백질 구조에 대한 지식에 의해 편향된 평가 또는 채점 기능을 적용하기 때문에 현재 'New Fold'라고 불리는 de novo 구조 예측.

CASP7 이후 카테고리는 메서드의 발전을 반영하도록 재정의되었습니다.'템플릿 기반 모델링' 범주에는 이전의 모든 비교 모델링, 상동 접기 기반 모델 및 유사한 접기 기반 모델이 포함됩니다.'템플릿 프리 모델링(FM)' 범주는 이전에 볼 수 없었던 접힘을 가진 단백질 모델과 단단한 유사 접힘 기반 모델을 포함한다.템플릿 프리 타겟의 수가 한정되어 있기 때문에(매우 드물기 때문에), 2011년에 CASP ROL이 도입되었습니다.이 연속(롤링) CASP 실험은 정기적인 CASP 예측 시즌 이외의 다수의 타깃 평가를 통해 템플릿 프리 예측 방법을 보다 엄격하게 평가하는 것을 목표로 한다.LiveBench EVA와 달리 이 실험은 CASP의 블라인드 예측 정신, 즉 아직 알려지지 않은 [10]구조에서 모든 예측을 한다.

CASP 결과는 CASP 웹사이트를 [11]통해 입수할 수 있는 과학 저널 단백질의 특별 보충호에 게재되어 있습니다.각 부록의 주요 기사는 실험의[12][13] 세부 사항을 설명하는 반면, 마무리 기사는 [14][15]해당 분야의 진행 상황을 평가합니다.

2018년 12월, CASP13은 [16]딥마인드만든 인공지능 프로그램인 알파폴드가 수상하여 화제가 되었다.2020년 11월에는 개량판 2의 AlphaFold가 [17]CASP14를 획득했습니다.CASP의 공동 설립자 중 한 명인 John Moult에 따르면, 알파폴드는 중간 정도의 난이도의 단백질 [18]표적에 대해 100점 척도의 예측 정확도에서 약 90점을 받았다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ Moult J, Pedersen JT, Judson R, Fidelis K (November 1995). "A large-scale experiment to assess protein structure prediction methods". Proteins. 23 (3): ii–v. doi:10.1002/prot.340230303. PMID 8710822. S2CID 11216440.
  2. ^ Tress ML, Ezkurdia I, Richardson JS (2009). "Target domain definition and classification in CASP8". Proteins. 77 Suppl 9 (Suppl 9): 10–7. doi:10.1002/prot.22497. PMC 2805415. PMID 19603487.
  3. ^ Zhang Y, Skolnick J (January 2005). "The protein structure prediction problem could be solved using the current PDB library". Proceedings of the National Academy of Sciences of the United States of America. 102 (4): 1029–34. Bibcode:2005PNAS..102.1029Z. doi:10.1073/pnas.0407152101. PMC 545829. PMID 15653774.
  4. ^ Cozzetto D, Kryshtafovych A, Fidelis K, Moult J, Rost B, Tramontano A (2009). "Evaluation of template-based models in CASP8 with standard measures". Proteins. 77 Suppl 9 (Suppl 9): 18–28. doi:10.1002/prot.22561. PMC 4589151. PMID 19731382.
  5. ^ Zemla A (July 2003). "LGA: A method for finding 3D similarities in protein structures". Nucleic Acids Research. 31 (13): 3370–4. doi:10.1093/nar/gkg571. PMC 168977. PMID 12824330.
  6. ^ Ben-David M, Noivirt-Brik O, Paz A, Prilusky J, Sussman JL, Levy Y (2009). "Assessment of CASP8 structure predictions for template free targets". Proteins. 77 Suppl 9 (Suppl 9): 50–65. doi:10.1002/prot.22591. PMID 19774550. S2CID 16517118.
  7. ^ Read RJ, Chavali G (2007). "Assessment of CASP7 predictions in the high accuracy template-based modeling category". Proteins. 69 Suppl 8 (Suppl 8): 27–37. doi:10.1002/prot.21662. PMID 17894351. S2CID 33172629.
  8. ^ Qian B, Raman S, Das R, Bradley P, McCoy AJ, Read RJ, Baker D (November 2007). "High-resolution structure prediction and the crystallographic phase problem". Nature. 450 (7167): 259–64. Bibcode:2007Natur.450..259Q. doi:10.1038/nature06249. PMC 2504711. PMID 17934447.
  9. ^ Keedy DA, Williams CJ, Headd JJ, Arendall WB, Chen VB, Kapral GJ, et al. (2009). "The other 90% of the protein: assessment beyond the Calphas for CASP8 template-based and high-accuracy models". Proteins. 77 Suppl 9 (Suppl 9): 29–49. doi:10.1002/prot.22551. PMC 2877634. PMID 19731372.
  10. ^ Kryshtafovych A, Monastyrskyy B, Fidelis K (February 2014). "CASP prediction center infrastructure and evaluation measures in CASP10 and CASP ROLL". Proteins. 82 Suppl 2: 7–13. doi:10.1002/prot.24399. PMC 4396618. PMID 24038551.
  11. ^ "CASP Proceedings".
  12. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Hubbard T, Tramontano A (2007). "Critical assessment of methods of protein structure prediction-Round VII". Proteins. 69 Suppl 8 (Suppl 8): 3–9. doi:10.1002/prot.21767. PMC 2653632. PMID 17918729.
  13. ^ Moult J, Fidelis K, Kryshtafovych A, Rost B, Tramontano A (2009). "Critical assessment of methods of protein structure prediction - Round VIII". Proteins. 77 Suppl 9 (Suppl 9): 1–4. doi:10.1002/prot.22589. PMID 19774620. S2CID 9704851.
  14. ^ Kryshtafovych A, Fidelis K, Moult J (2007). "Progress from CASP6 to CASP7". Proteins. 69 Suppl 8 (Suppl 8): 194–207. doi:10.1002/prot.21769. PMID 17918728. S2CID 40200832.
  15. ^ Kryshtafovych A, Fidelis K, Moult J (2009). "CASP8 results in context of previous experiments". Proteins. 77 Suppl 9 (Suppl 9): 217–28. doi:10.1002/prot.22562. PMC 5479686. PMID 19722266.
  16. ^ Sample, Ian (2 December 2018). "Google's DeepMind predicts 3D shapes of proteins". The Guardian. Retrieved 19 July 2019.
  17. ^ "DeepMind's protein-folding AI has solved a 50-year-old grand challenge of biology". MIT Technology Review. Retrieved 30 November 2020.
  18. ^ '모든 것을 변화시킬 것입니다.':DeepMind의 AI는 단백질 구조를 해결하는 데 큰 도약을 한다.

외부 링크

결과 순위

CASP14(2020)의 자동 평가

CASP13 자동평가(2018)

CASP12의 자동평가(2016년)

CASP11 자동평가(2014)

CASP10 자동평가(2012)

CASP9 자동평가(2010)

CASP8 자동평가(2008)

CASP7 자동평가(2006)