도킹을 위한 스코어링 기능

Scoring functions for docking
도킹 용어집
수신부 또는 호스트 또는 잠금
"수신" 분자, 가장 일반적으로 단백질이나 다른 생물다양체.
리간드 또는 게스트 또는
수용체에 결합되는 보완적 파트너 분자.리간드는 종종 작은 분자들이지만 또 다른 생물다양체일 수도 있다.
도킹
수용체에 대한 후보 리간드 결합의 계산 시뮬레이션.
바인딩 모드
수용체에 상대적인 리간드의 방향은 물론, 서로 결합했을 때 리간드와 수용기의 순응.
포즈
후보 바인딩 모드.
점수 매기기
수소 결합소수성 접촉과 같은 분자간 우호적 상호작용의 수를 세어 특정한 자세를 평가하는 과정.
순위
어떤 리간드가 특정 수용체에 유리하게 상호작용할 가능성이 가장 높은지를 바인딩의 예측된 자유 에너지에 기초하여 분류하는 과정.
도킹 평가(DA)
도킹 프로토콜의 예측 기능을 정량화하는 절차.
편집하다

계산 화학분자 모델링 분야에서 채점 함수는 두 분자가 도킹된 후 두 분자 사이의 결합 친화력을 대략적으로 예측하는 데 사용되는 수학적 함수다.가장 일반적으로 분자 중 하나는 약물과 같은 작은 유기 화합물이고, 두 번째는 단백질 수용체 같은 약물의 생물학적 목표물이다.[1]채점 기능도 두 단백질[2] 간 또는 단백질과 DNA분자간 상호작용의 강도를 예측하기 위해 개발되었다.[3]

효용

채점 기능은 약물 발견과 다른 분자 모델링 응용에 널리 사용된다.여기에는 다음이 포함된다.[4]

  • 후보 리간드의 소분자 데이터베이스를 가상으로 선별하여 관심 있는 단백질 대상에 결합되는 새로운 소분자를 식별하므로 약물 발견[5] 유용한 출발점이 된다.
  • 단백질 표적에[6] 결합하는 새로운 작은 분자의 드노보 디자인("원래부터"설계)
  • 선별 적중률의 리드 최적화를 통해 선호도 및 선택성[7] 최적화

점수 매기기 기능에 대해 잠재적으로 더 신뢰할 수 있지만 훨씬 더 계산적으로 요구되는 대안은 자유 에너지 섭동 계산이다.[8]

전제조건

채점 함수는 일반적으로 예측하고자 하는 종과 유사한 분자 종 사이의 실험적으로 결정된 결합 친화도로 구성된 데이터 세트에 대해 매개변수로 지정(또는 훈련)된다.

단백질에 대한 리간드의 친화력을 예측하기 위해 현재 사용되는 방법의 경우, 먼저 다음 사항을 알고 있거나 예측해야 한다.

  • 단백질 3차 구조 – 단백질 원자의 3차원 공간 배열단백질 구조는 X선 결정법이나 용액상 NMR 방법과 같은 실험 기법에 의해 결정되거나 동질학 모델링에 의해 예측될 수 있다.
  • 리간드 활성 순응 – 단백질에 묶였을 때 리간드의 3차원 형태
  • 바인딩 모드 – 콤플렉스에서 서로 상대적인 두 바인딩 파트너의 방향 설정

위의 정보는 단지의 3차원 구조를 산출한다.이 구조에 기초하여 채점 함수는 아래에 요약된 방법 중 하나를 사용하여 복합체 내 두 분자 사이의 연관성 강도를 추정할 수 있다.마지막으로 스코어링 기능 자체는 복합체 내 작은 분자의 결합 모드와 활성 준수를 예측하는 데 도움이 될 수 있으며, 도킹 실행 시 보다 간단하고 계산적으로 빠른 기능을 사용할 수 있다.

채점 기능의 일반 등급은 다음과 같이 네 가지다.[9][10][11]

  • 힘장 – 친화력은 힘장을 사용하여 복합체 내 두 분자의 모든 원자들 사이의 분자간 데르 발과 정전기 상호작용의 강도를 합산하여 추정한다.두 바인딩 파트너의 근내 에너지(변형 에너지라고도 함)도 자주 포함된다.마지막으로 결합은 일반적으로 물이 있는 곳에서 이루어지기 때문에, 리간드와 단백질의 황폐한 에너지는 때때로 GBSAPBSA같은 암묵적 용해 방법을 사용하여 고려된다.[12]
  • 경험적 – 두 바인딩 파트너 간의 다양한 유형의 상호작용 수를 계산하는 것에 기초한다.[6]계수는 서로 접촉하는 리간드 원자와 수용체 원자의 수에 기초하거나, 복합 리간드 및 단백질에 비해 단지 내 용매 접근성 표면 면적(ΔSASA)의 변화를 계산하여 계산할 수 있다.채점함수의 계수는 대개 다중 선형 회귀법을 사용하여 적합된다.함수의 이러한 상호작용 항에는 다음이 포함될 수 있다.
    • 소수성 - 소수성 접점(수분성 접점,
    • 소수성 - 소수성 접촉(불호감) (미충족 수소 결합에 대한 설명, 결합에 대한 중요한 엔탈피학적 기여.[13]손실 수소 결합 1개는 결합 친화력에서 1~2개의 크기를 차지할 수 있다.)[14]
    • 수소 결합의 수(특히 용매로부터 차폐된 경우, 용제가 아무런 기여를 하지 않는 경우),
    • 복잡한 형성에 고정된 회전 가능한 결합의 수(불완전한 순응 엔트로피 기여).
  • 지식 기반 – 통계 "평균 힘의 잠재력"을 도출하는 데 사용되는 대규모 3D 데이터베이스(Cambridge Structural Database 또는 단백질 데이터 뱅크 등)의 분자간 근접 접점에 대한 통계 관찰에 기초한다.이 방법은 무작위 분포에 의해 예상할 수 있는 것보다 더 자주 발생하는 특정 유형의 원자 또는 기능 그룹 간의 밀접한 분자간 상호작용은 에너지적으로 유리할 가능성이 높기 때문에 결합 친화력에 유리하게 기여한다는 가정에 근거한다.[15]
  • 머신러닝 – 이러한 고전적인 채점 기능과 달리 머신러닝 채점 기능은 결합 친화력과 단백질-리간드 콤플렉스를 설명하는 구조적 특징 사이의 관계에 대해 미리 정해진 기능 형태를 가정하지 않는 것이 특징이다.[16]이런 식으로 기능적 형태를 데이터로부터 직접 유추한다.기계학습 채점 기능은 다양한 단백질-리간드 복합체의 결합 친화도 예측에서 클래식 채점 기능을 능가하는 것으로 꾸준히 밝혀져 왔다.[17][18]이점은 대상 의존적이며 주로 이용 가능한 관련 데이터의 양에 따라 결정되지만,[19][20] 대상별 단지의 경우도 그러했다.[11][21]적절한 주의를 기울이면, 기계 학습 채점 기능은 구조 기반 가상 스크리닝의 관련 문제에서 고전적인 채점 기능을 강하게 능가하는 경향이 있다.[22][23][24][25][26][27][28][29]또한, 목표물에 특정된 데이터를 이용할 수 있는 경우, 이러한 성능 차이는 더욱[30] 커진다. 이러한 리뷰는 구조 기반 약물 설계를 위한 기계 학습 점수 매기기 기능에 대한 더 넓은 개요를 제공한다.[11][31][32][33]주어진 대상에 대한 미끼 선택은 모든 채점 기능을 훈련하고 테스트하기 위한 가장 중요한 요소 중 하나이다.[34]

처음 세 가지 유형인 힘-필드, 경험적, 지식 기반은 일반적으로 고전적 채점 함수로 언급되며 바인딩에 대한 기여도가 선형적으로 결합된다고 가정하는 것이 특징이다.이러한 제약으로 인해 고전적인 채점 기능은 많은 양의 훈련 데이터를 활용할 수 없다.[35]

정제

서로 다른 채점 기능이 상대적으로 공동선형이기 때문에 컨센서스 채점 기능이 정확도를 크게 향상시키지 못할 수 있다.[36]이전 연구들이 컨센서스 채점이 이롭다고 주장했기 때문에, 이 주장은 그 분야의 지배적인 견해에 다소 어긋났다.[37]

완벽한 채점 기능은 리간드와 리간드 대상 사이의 결합 자유 에너지를 예측할 수 있을 것이다.그러나 실제로는 계산 방법과 계산 자원이 모두 이 목표에 제약을 가했다.그래서 대부분 거짓 양성 및 거짓 음성 리간드의 수를 최소화하는 방법을 선택한다.결합 상수와 구조물의 실험적인 훈련 데이터를 이용할 수 있는 경우, 분자 도킹에 사용되는 채점 기능을 정교하게 하기 위한 간단한 방법이 개발되었다.[38]

참조

  1. ^ Jain AN (October 2006). "Scoring functions for protein-ligand docking". Current Protein & Peptide Science. 7 (5): 407–20. doi:10.2174/138920306778559395. PMID 17073693.
  2. ^ Lensink MF, Méndez R, Wodak SJ (December 2007). "Docking and scoring protein complexes: CAPRI 3rd Edition". Proteins. 69 (4): 704–18. doi:10.1002/prot.21804. PMID 17918726. S2CID 25383642.
  3. ^ Robertson TA, Varani G (February 2007). "An all-atom, distance-dependent scoring function for the prediction of protein-DNA interactions from structure". Proteins. 66 (2): 359–74. doi:10.1002/prot.21162. PMID 17078093. S2CID 24437518.
  4. ^ Rajamani R, Good AC (May 2007). "Ranking poses in structure-based lead discovery and optimization: current trends in scoring function development". Current Opinion in Drug Discovery & Development. 10 (3): 308–15. PMID 17554857.
  5. ^ Seifert MH, Kraus J, Kramer B (May 2007). "Virtual high-throughput screening of molecular databases". Current Opinion in Drug Discovery & Development. 10 (3): 298–307. PMID 17554856.
  6. ^ a b Böhm HJ (July 1998). "Prediction of binding constants of protein ligands: a fast method for the prioritization of hits obtained from de novo design or 3D database search programs". Journal of Computer-Aided Molecular Design. 12 (4): 309–23. Bibcode:1998JCAMD..12..309B. doi:10.1023/A:1007999920146. PMID 9777490. S2CID 7474036.
  7. ^ Joseph-McCarthy D, Baber JC, Feyfant E, Thompson DC, Humblet C (May 2007). "Lead optimization via high-throughput molecular docking". Current Opinion in Drug Discovery & Development. 10 (3): 264–74. PMID 17554852.
  8. ^ Foloppe N, Hubbard R (2006). "Towards predictive ligand design with free-energy based computational methods?". Current Medicinal Chemistry. 13 (29): 3583–608. doi:10.2174/092986706779026165. PMID 17168725.
  9. ^ Fenu LA, Lewis RA, Good AC, Bodkin M, Essex JW (2007). "Chapter 9: Scoring Functions: From Free-energies of Binding to Enrichment in Virtual Screening". In Dhoti H, Leach AR (eds.). Structure-Based Drug Discovery. Dordrecht: Springer. pp. 223–246. ISBN 978-1-4020-4407-6.
  10. ^ Sotriffer C, Matter H (2011). "Chapter 7.3: Classes of Scoring Functions". In Sotriffer C (ed.). Virtual Screening: Principles, Challenges, and Practical Guidelines. Vol. 48. John Wiley & Sons, Inc. ISBN 978-3-527-63334-0.
  11. ^ a b c Ain QU, Aleksandrova A, Roessler FD, Ballester PJ (2015-11-01). "Machine-learning scoring functions to improve structure-based binding affinity prediction and virtual screening". Wiley Interdisciplinary Reviews: Computational Molecular Science. 5 (6): 405–424. doi:10.1002/wcms.1225. PMC 4832270. PMID 27110292.
  12. ^ Genheden S, Ryde U (May 2015). "The MM/PBSA and MM/GBSA methods to estimate ligand-binding affinities". Expert Opinion on Drug Discovery. 10 (5): 449–61. doi:10.1517/17460441.2015.1032936. PMC 4487606. PMID 25835573.
  13. ^ Schneider N, Lange G, Hindle S, Klein R, Rarey M (January 2013). "A consistent description of HYdrogen bond and DEhydration energies in protein-ligand complexes: methods behind the HYDE scoring function". Journal of Computer-Aided Molecular Design. 27 (1): 15–29. Bibcode:2013JCAMD..27...15S. doi:10.1007/s10822-012-9626-2. PMID 23269578. S2CID 1545277.
  14. ^ Lange G, Lesuisse D, Deprez P, Schoot B, Loenze P, Bénard D, Marquette JP, Broto P, Sarubbi E, Mandine E (November 2003). "Requirements for specific binding of low affinity inhibitor fragments to the SH2 domain of (pp60)Src are identical to those for high affinity binding of full length inhibitors". Journal of Medicinal Chemistry. 46 (24): 5184–95. doi:10.1021/jm020970s. PMID 14613321.
  15. ^ Muegge I (October 2006). "PMF scoring revisited". Journal of Medicinal Chemistry. 49 (20): 5895–902. doi:10.1021/jm050038s. PMID 17004705.
  16. ^ Ballester PJ, Mitchell JB (May 2010). "A machine learning approach to predicting protein-ligand binding affinity with applications to molecular docking". Bioinformatics. 26 (9): 1169–75. doi:10.1093/bioinformatics/btq112. PMC 3524828. PMID 20236947.
  17. ^ Li H, Leung KS, Wong MH, Ballester PJ (February 2015). "Improving AutoDock Vina Using Random Forest: The Growing Accuracy of Binding Affinity Prediction by the Effective Exploitation of Larger Data Sets". Molecular Informatics. 34 (2–3): 115–26. doi:10.1002/minf.201400132. PMID 27490034. S2CID 3444365.
  18. ^ Ashtawy HM, Mahapatra NR (2015-04-01). "A Comparative Assessment of Predictive Accuracies of Conventional and Machine Learning Scoring Functions for Protein-Ligand Binding Affinity Prediction". IEEE/ACM Transactions on Computational Biology and Bioinformatics. 12 (2): 335–47. doi:10.1109/TCBB.2014.2351824. PMID 26357221.
  19. ^ Zhan W, Li D, Che J, Zhang L, Yang B, Hu Y, Liu T, Dong X (March 2014). "Integrating docking scores, interaction profiles and molecular descriptors to improve the accuracy of molecular docking: toward the discovery of novel Akt1 inhibitors". European Journal of Medicinal Chemistry. 75: 11–20. doi:10.1016/j.ejmech.2014.01.019. PMID 24508830.
  20. ^ Kinnings SL, Liu N, Tonge PJ, Jackson RM, Xie L, Bourne PE (February 2011). "A machine learning-based method to improve docking scoring functions and its application to drug repurposing". Journal of Chemical Information and Modeling. 51 (2): 408–19. doi:10.1021/ci100369f. PMC 3076728. PMID 21291174.
  21. ^ Li H, Sze K-H, Lu G, Ballester PJ (2020-02-05). "Machine-Learning Scoring Functions for Structure-Based Drug Lead Optimization". Wiley Interdisciplinary Reviews: Computational Molecular Science. 10 (5). doi:10.1002/wcms.1465.
  22. ^ Li L, Wang B, Meroueh SO (September 2011). "Support vector regression scoring of receptor-ligand complexes for rank-ordering and virtual screening of chemical libraries". Journal of Chemical Information and Modeling. 51 (9): 2132–8. doi:10.1021/ci200078f. PMC 3209528. PMID 21728360.
  23. ^ Durrant JD, Friedman AJ, Rogers KE, McCammon JA (July 2013). "Comparing neural-network scoring functions and the state of the art: applications to common library screening". Journal of Chemical Information and Modeling. 53 (7): 1726–35. doi:10.1021/ci400042y. PMC 3735370. PMID 23734946.
  24. ^ Ding B, Wang J, Li N, Wang W (January 2013). "Characterization of small molecule binding. I. Accurate identification of strong inhibitors in virtual screening". Journal of Chemical Information and Modeling. 53 (1): 114–22. doi:10.1021/ci300508m. PMC 3584174. PMID 23259763.
  25. ^ Wójcikowski M, Ballester PJ, Siedlecki P (April 2017). "Performance of machine-learning scoring functions in structure-based virtual screening". Scientific Reports. 7: 46710. Bibcode:2017NatSR...746710W. doi:10.1038/srep46710. PMC 5404222. PMID 28440302.
  26. ^ Ragoza M, Hochuli J, Idrobo E, Sunseri J, Koes DR (April 2017). "Protein-Ligand Scoring with Convolutional Neural Networks". Journal of Chemical Information and Modeling. 57 (4): 942–957. arXiv:1612.02751. doi:10.1021/acs.jcim.6b00740. PMC 5479431. PMID 28368587.
  27. ^ Li H, Peng J, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (March 2018). "The Impact of Protein Structure and Sequence Similarity on the Accuracy of Machine-Learning Scoring Functions for Binding Affinity Prediction". Biomolecules. 8 (1): 12. doi:10.3390/biom8010012. PMC 5871981. PMID 29538331.
  28. ^ Imrie F, Bradley AR, Deane CM (February 2021). "Generating Property-Matched Decoy Molecules Using Deep Learning". Bioinformatics. 37 (btab080): 2134–2141. doi:10.1093/bioinformatics/btab080. PMC 8352508. PMID 33532838.
  29. ^ Adeshina YO, Deeds EJ, Karanicolas J (August 2020). "Machine learning classification can reduce false positives in structure-based virtual screening". Proceedings of the National Academy of Sciences of the United States of America. 117 (31): 18477–18488. doi:10.1073/pnas.2000585117. PMC 7414157. PMID 32669436.
  30. ^ Xiong GL, Ye WL, Shen C, Lu AP, Hou TJ, Cao DS (June 2020). "Improving structure-based virtual screening performance via learning from scoring function components". Briefings in Bioinformatics. 22 (bbaa094). doi:10.1093/bib/bbaa094. PMID 32496540.
  31. ^ Shen C, Ding J, Wang Z, Cao D, Ding X, Hou T (2019-06-27). "From Machine Learning to Deep Learning: Advances in Scoring Functions for Protein–ligand Docking". Wiley Interdisciplinary Reviews: Computational Molecular Science. 10. doi:10.1002/wcms.1429. S2CID 198336898.
  32. ^ Yang X, Wang Y, Byrne R, Schneider G, Yang S (2019-07-11). "Concepts of Artificial Intelligence for Computer-Assisted Drug Discovery". Chemical Reviews. 119 (18): 10520–10594. doi:10.1021/acs.chemrev.8b00728. PMID 31294972.
  33. ^ Li H, Sze K-H, Lu G, Ballester PJ (2020-04-22). "Machine-Learning Scoring Functions for Structure-Based Virtual Screening". Wiley Interdisciplinary Reviews: Computational Molecular Science. 11. doi:10.1002/wcms.1478. S2CID 219089637.
  34. ^ Ballester PJ (December 2019). "Selecting machine-learning scoring functions for structure-based virtual screening". Drug Discovery Today: Technologies. 32–33: 81–87. doi:10.1016/j.ddtec.2020.09.001. PMID 33386098. S2CID 224968364.
  35. ^ Li H, Peng J, Sidorov P, Leung Y, Leung KS, Wong MH, Lu G, Ballester PJ (March 2019). "Classical scoring functions for docking are unable to exploit large volumes of structural and interaction data". Bioinformatics. Oxford, England. 35 (20): 3989–3995. doi:10.1093/bioinformatics/btz183. PMID 30873528.
  36. ^ Englebienne P, Moitessier N (June 2009). "Docking ligands into flexible and solvated macromolecules. 4. Are popular scoring functions accurate for this class of proteins?". Journal of Chemical Information and Modeling. 49 (6): 1568–80. doi:10.1021/ci8004308. PMID 19445499.
  37. ^ Oda A, Tsuchida K, Takakura T, Yamaotsu N, Hirono S (2006). "Comparison of consensus scoring strategies for evaluating computational models of protein-ligand complexes". Journal of Chemical Information and Modeling. 46 (1): 380–91. doi:10.1021/ci050283k. PMID 16426072.
  38. ^ Hellgren M, Carlsson J, Ostberg LJ, Staab CA, Persson B, Höög JO (September 2010). "Enrichment of ligands with molecular dockings and subsequent characterization for human alcohol dehydrogenase 3". Cellular and Molecular Life Sciences. 67 (17): 3005–15. doi:10.1007/s00018-010-0370-2. PMID 20405162. S2CID 2391130.