자체 일관성 있는 평균 필드(생물학)
Self-consistent mean field (biology)자기 일치 평균장(SCMF)[1] 방법은 단백질 구조 예측에 사용되는 평균장 이론을 적응시켜 고정 단백질 백본에 주어진 최적의 아미노산 사이드 체인 패킹을 결정하는 방법이다.데드엔드 제거보다 빠르지만 정확도가 떨어지며 일반적으로 관심 단백질이 너무 커서 문제가 DE에 의해 다루기 어려운 상황에서 사용된다.[2]
통칙, 일반원칙
데드 엔드 제거와 마찬가지로, SCMF 방법은 각 측면 사슬의 이면 각도를 단백질 시퀀스의 각 위치에 대한 로타머 집합으로 분해하여 순응적 공간을 탐색한다.이 방법은 각 위치에서 가능한 각 로타머의 상대 모집단에 대한 확률론적 설명을 반복적으로 개발하며, 주어진 구조의 확률은 개별 로타머 성분의 확률 함수로서 정의된다.
효과적인 SCMF 구현을 위한 기본 요건은 다음과 같다.
- 잘 정의된 이산 독립 변수 유한 집합
- 변수 집합의 각 원소와 연관되고 각 이항 요소 쌍과 연관된 사전 계산된 숫자 값("에너지"로 간주됨)
- 각 개별 로타머의 시작 모집단을 설명하는 초기 확률 분포
- 평균장 에너지의 함수로써 로타머 에너지와 확률을 갱신하는 방법
프로세스는 일반적으로 로타머에 대한 균일한 확률 분포로 초기화된다. 즉, 단백질의 위치에 위치에 p {\ A 개별 의 확률은 1/이다에너지와 확률 사이의 변환은 일반적으로 온도 인자(즉, 시뮬레이션된 어닐링에 부합하는 방법을 만드는 방법)를 도입하는 볼츠만 분포를 통해 이루어진다.낮은 온도는 작은 솔루션 하위 모집단보다는 단일 솔루션으로 수렴할 가능성을 높인다.
평균장 에너지
개별 로타머 의 에너지는 다른 포지션의 "평균 필드" 에너지에 의존한다. 즉, 다른 포지션에서는 각 로타머의 에너지 기여도가 확률에 비례한다.잔류물당 로타머가 있는 N 의 단백질의 경우, 현재 반복에서의 에너지는 다음 표현으로 설명된다.Note that for clarity, the mean-field energy at iteration is denoted by , whereas the precomputed energies are denoted by , and the probability of a given rotamer is denoted by .
이러한 평균장 에너지는 볼츠만 법칙을 통해 확률을 갱신하는 데 사용된다.
여기서 은 (는) 볼츠만 상수이고 은 (는) 온도 계수다.
시스템의 에너지
SCMF 방법 수행 시 시스템 에너지 계산이 필요하지는 않지만, 수렴된 결과의 전체 에너지를 아는 것이 유용하다.시스템 에너지 y 은(는) 두 가지 합으로 구성된다.
추가사항이 다음과 같이 정의된다.
수렴
SCMF 방법에 대한 완벽한 수렴은 단백질 내 각 k 에서 정확히 하나의 로타머에 대해 1의 확률을, 각 위치의 다른 모든 로타머에 대해 0의 확률을 산출한다.고유한 솔루션으로 수렴하려면 각 위치에서 정확히 한 로타머에 대해 1에 가까운 확률을 요구한다.실제로 특히 높은 온도를 사용하는 경우 알고리즘은 대신 각 위치에서 소수의 높은 확률의 로타머를 식별하여 결과 순응의 상대적 에너지를 열거할 수 있다(평균장 근사치에서 도출된 에너지가 아닌 사전 계산된 에너지에 기초함).수렴을 개선하는 한 가지 방법은 이전 고온 주행에서 계산된 확률을 사용하여 낮은 온도에서 다시 실행하는 것이다.
정확도
데드 엔드 제거와 달리, SCMF는 최적의 솔루션으로 수렴할 것을 보장하지 않는다.단, 몬테카를로 분석에 의존하는 대안과는 달리 결정론적(동일한 초기 조건을 부여할 때마다 동일한 해법으로 수렴할 것이다.)이다.최적의 솔루션을 찾을 수 있다고 보장된 DE에 비해 SCMF는 전반적으로 더 빠르지만 덜 정확하다. 즉, 정확한[3] 표면 순응을 확인하는 것보다 단백질 노심에서의 올바른 사이드 체인 순응을 식별하는 것이 훨씬 더 낫다.기하학적 패킹 제약조건은 표면적으로 제한성이 낮기 때문에 적합성 검색에 대한 경계를 더 적게 제공한다.