일치 분자쌍 분석

Matched molecular pair analysis

매치 분자쌍 분석(MMPA)은 화학정보학에서 수소 원자를 염소로 치환하는 것과 같이 단일 화학적 변환만으로 다른 두 분자의 특성을 비교하는 방법이다.이러한 화합물 쌍은 일치 분자 쌍(MMP)으로 알려져 있습니다.두 분자의 구조적 차이가 작기 때문에 매칭된 분자쌍 간의 물리적 또는 생물학적 특성에서 실험적으로 관찰된 변화는 보다 쉽게 해석될 수 있다.이 용어는 케니와 사도스키에 의해 "Drug Discovery"[1]라는 책에서 처음 만들어졌다.

서론

MMP는 작은 단일점 변화만 다른 분자 쌍으로 정의할 수 있다(그림 1 참조).매치 분자쌍(MMP)은 생물학적 활성, 독성, 환경적 위험 등을 포함한 화합물 성질의 변화를 연구하기 위해 의약화학에서 널리 사용된다. 이는 명확한 구조적 변화와 관련이 있다.분자쌍의 단일점 변화를 화학변환 또는 분자변환이라고 한다.각 분자쌍은 특정 변환과 관련되어 있다.변환의 예로는 기능 그룹을 다른 기능 그룹으로 교체하는 것이 있습니다.보다 구체적으로 분자변환은 1개, 2개 또는 3개의 부착점을 가진 분자단편을 다른 단편으로 치환하는 것으로 정의할 수 있다.특정 상황에서 유용한 분자 변환은 "중요한" 변환이라고 불립니다.예를 들어 변환은 화학성분의 바람직한 특성을 체계적으로 감소시키거나 증가시킬 수 있다.통계적으로 유의한 의미에서 특정 속성/활동에 영향을 미치는 변환을 유의한 변환이라고 합니다.변환이 속성 값을 감소시키는 것보다 "더 자주" 증가하거나 그 반대로 증가하는 경우 변환은 중요한 것으로 간주됩니다.따라서 증가 쌍과 감소 쌍들의 분포는 특정 p-값(일반적으로 0.05)을 갖는 이항("효과 없음") 분포와 유의하게 달라야 합니다.

그림 1: 샘플 MMP (주황색으로 강조 표시된 차이):

MMP 기반 분석의 중요성

MMP 기반 분석은 알고리즘적으로 생성될 수 있고 화합물 쌍 수준에서 정의된 구조 수정과 생물학적 [2][3][4]활동을 포함한 화학적 특성 변화를 연관시킬 수 있기 때문에 계산 분석을 위한 매력적인 방법이다.

해석 가능한 QSAR 모델

MMPA는 정량적 구조-활동 관계(QSAR) 모델링 연구 분야에서 매우 유용하다.QSAR 모델의 문제 중 하나는 화학적으로 의미 있는 방식으로 해석하기 어렵다는 것이다.단순한 선형 회귀 모델을 해석하는 것은 매우 쉬울 수 있지만, 뉴럴 네트워크와 같은 가장 강력알고리즘인 서포트 벡터 머신은 쉽게 [5]해석할 수 없는 예측을 제공하는 "블랙 박스"와 유사합니다.이 문제는 의약품 화학자가 결정을 내리는 데 있어 QSAR 모델의 적용 가능성을 약화시킨다.이 화합물이 일부 미생물에 대해 활성으로 예측될 경우, 그 활성의 원동력은 무엇입니까?또는 비액티브할 것으로 예상되는 경우, 그 액티비티를 어떻게 조정할 수 있습니까?QSAR 모델의 블랙박스 특성으로 인해 이러한 중요한 문제에 대처할 수 없습니다.예측된 MMP를 사용하면 모델을 해석하고 [6]모델에 의해 학습된 MMP를 식별할 수 있습니다.모델에 의해 재현되지 않은 MMP는 모델의 실험 오류 또는 결함에 해당될 수 있다(부적절한 설명자, 너무 적은 데이터 등).

MMPs(Matched Molecular Pair) 분석은 작용 메커니즘을 이해하는 데 매우 유용할 수 있습니다.약제사는 특히 "활동절벽"에 관심이 있을 수 있습니다.활동 절벽은 사소한 구조 변경으로 대상 활동을 크게 변화시킨다.

액티비티 클리프

활동 절벽은 분자 특성에 상당한 영향을 미치는 사소한 구조적 변형이다.액티비티 절벽은 보통 SAR 정보 함량이 높습니다.왜냐하면 일련의 유사한 화합물의 작은 화학적 변화는 활성의 큰 변화를 초래하기 때문이다.활동 절벽의 평가는 유사성과 효력 차이[7][8][9] 기준을 신중하게 고려해야 한다.

MMP 기반 분석 유형

일치 분자쌍(MMPA) 분석은 감독 MMPA와 비감독 MMPA의 두 가지 유형으로 분류할 수 있다.

관리 대상 MMPA

감독된 MMPA에서는 화학적 변환이 미리 정의되어 데이터 세트 내에서 대응하는 일치 쌍 화합물이 발견되며 각 변환에 대해 계산된 엔드 포인트의 변화가 계산된다.

비감독 MMPA

자동 MMPA라고도 합니다.기계학습 알고리즘은 데이터 세트 내의 가능한 모든 일치 쌍을 미리 정의된 규칙 세트에 따라 찾기 위해 사용된다.그 결과 일치하는 쌍의 수가 훨씬 많아지고 고유한 변환이 프로세스 중에 필터링되어 통계적으로 중요한 대상 속성 변경에 대응하는 변환이 적절한 수의 일치하는 쌍으로 식별됩니다.

일치 분자 계열

여기서는 한 지점에서만 다른 분자 쌍을 보는 대신, 한 지점에서 서로 다른 두 개 이상의 분자의 연속을 고려합니다.매칭 분자 계열의 개념은 Wawer와 Bajorath에 [10]의해 도입되었습니다.일치된 긴 계열은 선호된 분자 변환을 보일 가능성이 높은 반면, 일치된 쌍은 작은 [11]선호만 보입니다.

제한 사항

리간드 역가의 최적화를 위해 대형 화학 데이터베이스에 MMPA를 적용하는 것은 문제가 있다. 왜냐하면 동일한 구조적 변환이 데이터 집합에서 다른 화합물의 역량에 영향을 미치거나 증가하거나 감소하지 않을 수 있기 때문이다.분자 데이터 집합에서 실용적인 중요한 변환의 선택은 MMPA에서 어려운 문제이다. 또한 특정 분자 변환의 효과는 화학적 [12][13]변환의 맥락에 크게 의존할 수 있다.

이 외에도, MMPA는 특히 깨지기 쉬운 결합이 많은 화합물 데이터베이스를 다룰 때 계산 자원의 측면에서 몇 가지 제한을 가할 수 있다.또한 분자의 가변부에 원자가 많아지면 조합폭발 문제도 발생한다.이를 처리하기 위해 가변 부분의 깨지기 쉬운 결합 수와 원자 수를 사용하여 데이터베이스를 사전 필터링할 수 있습니다.

레퍼런스

  1. ^ Kenny, Peter W.; Sadowski, Jens (2005). "Chapter 11: Structure Modification in Chemical Databases". In Oprea, Tudor I. (ed.). Chemoinformatics in Drug Discovery. Wiley-VCH Verlag GmbH & Co. KGaA. pp. 271–285.
  2. ^ Griffen, Ed; Leach, Andrew G.; Robb, Graeme R.; Warner, Daniel J. (2011). "Matched molecular pairs as a medicinal chemistry tool". J. Med. Chem. 54 (22): 7739–50. doi:10.1021/jm200452d. PMID 21936582.
  3. ^ Wassermann, A.M.; Dimova, D.; Iyer P; et al. (2012). "Advances in computational medicinal chemistry: matched molecular pair analysis". Drug Development Research. 73 (8): 518–527. doi:10.1002/ddr.21045. S2CID 82321850.
  4. ^ Dossetter, Alexander G.; Griffen, Edward J.; Leach, Andrew G. (2013). "Matched molecular pair analysis in drug discovery". Drug Discovery Today. 18 (15–16): 724–731. doi:10.1016/j.drudis.2013.03.003. PMID 23557664.
  5. ^ Cumming, J.; et al. (2013). "Chemical predictive modelling to improve compound quality". Nature Reviews Drug Discovery. 12 (12): 948–962. doi:10.1038/nrd4128. PMID 24287782. S2CID 6218976.
  6. ^ Sushko, Yurii; Novotarskyi, Sergii; Körner, Robert; Vogt, Joachim; Abdelaziz, Ahmed; Tetko, Igor V (2014-12-11). "Prediction-driven matched molecular pairs to interpret QSARs and aid the molecular optimization process". Journal of Cheminformatics. 6 (1): 48. doi:10.1186/s13321-014-0048-0. PMC 4272757. PMID 25544551.
  7. ^ Stumpfe D, Bajorath J: 의약화학 활동 절벽 탐색.J Med Chem. 2012; 55(7): 2932–2942 PMID 22236250
  8. ^ Stumpfe D, Hu Y, Dimova D 등:활동 절벽과 그 효용에 대한 최근의 이해의 진보.J Med Chem. 2014; 57 (1): 18~28.PMID 23981118
  9. ^ Hu Y, Stumpfe D, Bajorath J: 액티비티 절벽 개념의 진전 [v1; ref status: indexed, http://f1000r.es/1wf]F1000Res. 2013; 2: 199.doi:10.12688/f1000 research.2-199.v1
  10. ^ Wawer, Mathias; Bajorath, Jürgen (2011). "Local Structural Changes, Global Data Views: Graphical Substructure−Activity Relationship Trailing". J. Med. Chem. 54 (8): 2944–2951. doi:10.1021/jm200026b. PMID 21443196.
  11. ^ O'Boyle, Noel M.; Boström, Jonas; Sayle, Roger A.; Gill, Adrian (2014). "Using Matched Molecular Series as a Predictive Tool To Optimize Biological Activity". J. Med. Chem. 57 (6): 2704–2713. doi:10.1021/jm500022q. PMC 3968889. PMID 24601597.
  12. ^ Warner, D. J.; Bridgland-Taylor, M. H.; Sefton, C. E.; Wood, D. J. (2012). "Prospective prediction of antitarget activity by matched molecular pairs analysis". Mol. Inform. 31 (5): 365–368. doi:10.1002/minf.201200020. PMID 27477265. S2CID 5430494.
  13. ^ Hajduk, P.J.; Sauer, D.R. (2008). "Statistical analysis of the effects of common chemical substituents on ligand potency". J. Med. Chem. 51 (3): 553–64. doi:10.1021/jm070838y. PMID 18173228.