격자단백질

Lattice protein

격자 단백질단백질 접힘을 조사하는 데 사용되는 격자 순응 공간의 단백질과 같은 이단층 체인의 고도로 단순화된 모델이다.[1] 격자 단백질의 단순화는 두 가지인데, 각 전체 잔류물(아미노산)은 유한한 유형의 단일 "비드" 또는 "포인트"로 모델링되며, 각 잔류물은 (일반적으로 입방체) 격자의 정점에 놓이도록 제한된다.[1] 단백질 체인의 연결을 보장하기 위해 백본에 인접한 잔류물을 격자의 인접 정점에 배치해야 한다.[2] 강직 구속조건은 동일한 격자 정점에 둘 이상의 잔류물을 배치할 수 없다는 것을 부과함으로써 표현된다.[2]

단백질은 매우 큰 분자이기 때문에, 모든 원자 세부사항으로 모델링했을 때 그들의 행동에 대한 시뮬레이션된 시간 계산에 심각한 한계가 있다. 모든 원자 시뮬레이션을 위한 밀리초 체제는 2010년까지 도달하지 못했으며,[3] 컴퓨터에 있는 모든 실제 단백질을 접는 것은 여전히 불가능하다. 단순화는 비록 이 단순화된 시나리오에서조차 단백질 접힘 문제가 NP-완전하지만 모델을 다루는 계산 노력을 상당히 감소시킨다.[4]

개요

격자 단백질의 다른 버전은 2-3차원으로 다른 종류의 격자(일반적으로 정사각형과 삼각형)를 채택할 수 있지만, 일반적인 격자는 균일한 접근방식을 통해 사용 및 취급할 수 있는 것으로 나타났다.[2]

격자 단백질은 인접한 격자 부지를 점유하고 있는 염주 사이의 상호작용 에너지를 명시하는 조건인 에너지 함수를 도입하여 실제 단백질과 유사하게 만들어진다.[5] 에너지 기능은 실제 단백질에서 아미노산 사이의 상호작용을 모방하는데, 여기에는 강체, 소수성, 수소 결합 효과가 포함된다.[2] 구슬은 종류별로 나뉘는데, 아미노산 종류에 따라 서로 다른 교호작용을 하는 것처럼 에너지함수도 구슬 종류에 따라 교호작용을 명시한다.[5] 대표적인 격자 모델 중 하나인 소수성-극성 모델(HP 모델)[6]소수성(H)과 극성(P)의 두 가지 비드 형태만 특징으로 H 비드 간 상호작용을 호의적으로 명시해 소수성 효과를 모방한 것이 특징이다.[5]

특정 구조물의 어떤 시퀀스에 대해, 에너지는 에너지 기능으로부터 빠르게 계산될 수 있다. 단순 HP 모델의 경우, 이는 구조물에 인접하지만 체인에 인접하지 않은 H 잔여물 사이의 모든 접점을 열거한 것이다.[7] 대부분의 연구자들은 접힌 상태의 앙상블을 고려하는 예외는 있지만 다른 어떤 구조보다 낮은 에너지 상태의 단일 구조를 가진 경우에만 격자 단백질 서열을 단백질과 유사한 것으로 간주한다.[8] 이것은 활기찬 지상국, 즉 토착국이다. 고유 상태에서 구슬의 상대적 위치는 격자 단백질의 3차 구조[citation needed] 구성한다. 격자 단백질은 진짜 2차 구조를 가지고 있지 않지만, 일부 연구자들은 서로 다른 물질의 위상도를 서로 확장시킬 수 있는 동일한 법칙(해당 상태의 정리)에 호소함으로써 2차 구조를 포함하는 실제 단백질 구조로 외삽될 수 있다고 주장해왔다.[9]

체인의 에너지 기능과 비드 순서(일차 구조)를 변화시킴으로써, 고유 상태 구조와 접힘의 운동학에 미치는 영향을 탐색할 수 있으며, 이것이 실제 단백질의 접힘에 대한 통찰력을 제공할 수도 있다.[10] 그 예들 중 일부는 단백질의 2상 접이역학(polding kinetics)과 유사하다고 논의되어 온 격자단백질의 접이과정 연구를 포함한다. 격자 단백질은 빠르게 콤팩트한 상태로 붕괴되고 이후 천천히 후속적으로 구조물을 고유 상태로 재배열하는 것으로 나타났다.[11] 단백질 접힘에서 레빈탈 역설을 해결하려는 시도도 현장에서의 노력이다. 예를 들어, 피빅과 딜이 수행한 연구는 단백질이 전지구적 철저한 검색 없이 어떻게 고유 구조를 발견하는지에 대한 통찰력을 제공하기 위해 격자 단백질에서 잔류 접점을 형성하는 제약조건과 관련된 검색 방법을 조사했다.[12] 격자 단백질 모델은 단백질의 에너지 풍경, 즉 순응 함수로서의 내부 자유 에너지의 변동을 조사하는데도 이용되어 왔다.[citation needed]

선반

격자는 "에지"에 의해 연결되는 질서 정연한 점들의 집합이다.[2] 이러한 점을 정점이라고 하며 가장자리별로 격자의 다른 정점에 연결된다. 각 개별 꼭지점이 연결되는 정점의 수를 격자의 조정 번호라고 하며, 격자의 형상이나 치수(예를 들어 2차원~3차원)를 변경하여 위아래로 스케일업할 수 있다.[2] 이 숫자는 주어진 잔류물에 인접하도록 허용된 다른 잔류물의 수를 제어하기 때문에 격자 단백질의 특성을 형성하는데 중요하다.[2] 가장 일반적으로 사용되는 격자에는 이 범위의 하단에 조정 번호가 있지만 대부분의 단백질의 경우 사용된 격자의 조정 번호가 3과 20 사이에 있어야 한다는 것이 밝혀졌다.[2]

격자 모양은 격자 단백질 모델의 정확도에 중요한 요인이다. 격자 모양을 바꾸면 정력적으로 유리한 순응형태를 극적으로 바꿀 수 있다.[2] 또한 동일한 패리티(이상하거나 심지어 번호가 매겨진)의 정사각형 및 입방 격자 잔류물이 소수성 접촉을 할 수 없는 패리티 문제의 경우처럼 단백질 구조에 비현실적인 제약을 추가할 수 있다.[5] 또한 삼각형 격자는 결정학적 데이터와 비교했을 때 다른 격자 모양보다 더 정확한 구조를 산출한다고 보고되었다.[2] 패리티 문제와 싸우기 위해, 여러 연구자들은 가능한 경우 삼각 격자를 사용할 것과 더불어 정사각형 행렬이 더 적절할 수 있는 이론적 용도에 대각선이 있는 정사각형 행렬을 사용할 것을 제안했다.[5] 삼각 격자 내 인접 잔여물의 급격한 회전을 완화하기 위해 육각형 격자가 도입되었다.[13] 대각선이 있는 육각형 격자도 패리티 문제를 해결하는 방법으로 제시됐다.[2]

소수성-극성 모델

일반 폴리펩타이드의 열역학적으로 안정적인 순응에 대한 도식. 소수성 접점의 수가 많다는 점에 유의하십시오. 아미노산 잔류물은 하얀 선을 따라 점으로 표현된다. 소수성 잔류물은 녹색이고 극성 잔류물은 파란색이다.
일반 폴리펩타이드의 열역학적으로 불안정한 순응에 대한 도식. 위보다 적은 수의 소수성 접점에 유의하십시오. 소수성 잔류물은 녹색, 극성 잔류물은 파란색이다.

소수성-극단백질 모델은 원래 격자 단백질 모델이다. 단백질 구조를 예측하기 위해 단백질 내 아미노산친수성만을 사용하여 단백질 구조를 예측하는 데 드는 상당한 비용과 난이도를 극복하기 위한 방안으로 딜 등이 1985년 처음 제안했다.[5] 패러다임 격자 단백질 모델로 꼽힌다.[2] 이 방법은 단백질을 "2D 사각 격자 위의 짧은 사슬"로 표현함으로써 단백질 구조의 추정치를 신속하게 제시할 수 있었고, 이후 소수성-극성 모델로 알려지게 되었다. 그것은 단백질 접힘 문제를 세 가지 별개의 문제로 분해한다: 단백질 순응을 모델링하는 것, 아미노산이 상호 작용하여 순응을 찾을 때의 에너지 특성을 정의하는 것, 그리고 이러한 순응을 예측하기 위한 효율적인 알고리즘을 개발하는 것. 단백질의 아미노산을 소수성 또는 극성으로 분류하고 단백질이 수용성 환경에서 접혀진다고 가정하여 이루어진다. 격자 통계 모델은 소수성 아미노산 사이의 접촉부의 자유 에너지를 최소화함으로써 단백질 접힘을 재현하려고 한다. 소수성 아미노산 잔류물은 서로 뭉칠 것으로 예측되는 반면 소수성 잔류물은 주변 물과 상호작용을 한다.[5]

HP 모델로 단백질 접기를 연구하기 위해 다른 격자 유형과 알고리즘이 사용되었다. 2차원 및 3차원, 정사각형 및 삼각형 격자의 근사 알고리즘을 사용하여 더 높은 근사비를 얻기 위해 노력했다. 근사 알고리즘의 대안으로, 일부 유전 알고리즘은 사각형, 삼각형, 얼굴 중심 큐빅 격자로도 활용되었다.[14]

문제 및 대안 모델

소수성-극성 모델의 단순성은 사람들이 대체 격자 단백질 모델로 고치려고 시도했던 몇 가지 문제를 야기시켰다.[5] 이러한 문제들 중 가장 중요한 것은 퇴행성의 문제인데, 이는 모델링된 단백질에 대한 최소 에너지 순응이 두 개 이상 있을 때, 어떤 순응이 본래의 것인지에 대한 불확실성으로 이어진다. 이를 해결하기 위한 시도는 아미노산을 아미노산 전하량에 따라 소수성(H), 양성(P), 음성(N), 중성(X)으로 분류하는 HPNX 모델을 포함하며,[15] 낮은 에너지 순응 횟수를 줄이고 보다 현실적인 단백질 시뮬레이션을 가능하게 하기 위해 추가 파라미터를 추가한다.[5] 또 다른 모델은 수정 구조에서 채취한 단백질 특성을 이용하여 고유 순응의 선택을 알려주는 Crapten 모델이다.[16]

격자 모델의 또 다른 문제는 그들이 α-탄소만을 고려하는 대신 일반적으로 아미노산 사이드 체인이 차지하는 공간을 고려하지 않는다는 것이다.[2] 사이드 체인 모델은 α-탄소 근처의 정점에 사이드 체인을 추가하여 이를 해결한다.[17]

참조

  1. ^ a b Lau KF, Dill KA (1989). "A lattice statistical mechanics model of the conformational and sequence spaces of proteins". Macromolecules. 22 (10): 3986–97. Bibcode:1989MaMol..22.3986L. doi:10.1021/ma00200a030.
  2. ^ a b c d e f g h i j k l m Bechini A (2013). "On the characterization and software implementation of general protein lattice models". PLOS ONE. 8 (3): e59504. Bibcode:2013PLoSO...859504B. doi:10.1371/journal.pone.0059504. PMC 3612044. PMID 23555684.
  3. ^ Voelz VA, Bowman GR, Beauchamp K, Pande VS (February 2010). "Molecular simulation of ab initio protein folding for a millisecond folder NTL9(1-39)". Journal of the American Chemical Society. 132 (5): 1526–8. doi:10.1021/ja9090353. PMC 2835335. PMID 20070076.
  4. ^ Berger B, Leighton T (1998). "Protein folding in the hydrophobic-hydrophilic (HP) model is NP-complete". Journal of Computational Biology. 5 (1): 27–40. doi:10.1089/cmb.1998.5.27. PMID 9541869.
  5. ^ a b c d e f g h i Dubey SP, Kini NG, Balaji S, Kumar MS (2018). "A Review of Protein Structure Prediction Using Lattice Model". Critical Reviews in Biomedical Engineering. 46 (2): 147–162. doi:10.1615/critrevbiomedeng.2018026093. PMID 30055531.
  6. ^ Dill KA (March 1985). "Theory for the folding and stability of globular proteins". Biochemistry. 24 (6): 1501–9. doi:10.1021/bi00327a032. PMID 3986190.
  7. ^ Su SC, Lin CJ, Ting CK (December 2010). "An efficient hybrid of hill-climbing and genetic algorithm for 2D triangular protein structure prediction". 2010 IEEE International Conference on Bioinformatics and Biomedicine Workshops (BIBMW). IEEE. pp. 51–56. doi:10.1109/BIBMW.2010.5703772. ISBN 978-1-4244-8303-7. S2CID 44932436.
  8. ^ Bertram, Jason; Masel, Joanna (April 2020). "Evolution Rapidly Optimizes Stability and Aggregation in Lattice Proteins Despite Pervasive Landscape Valleys and Mazes". Genetics. 214 (4): 1047–1057. doi:10.1534/genetics.120.302815. PMC 7153934. PMID 32107278.
  9. ^ Onuchic JN, Wolynes PG, Luthey-Schulten Z, Socci ND (April 1995). "Toward an outline of the topography of a realistic protein-folding funnel". Proceedings of the National Academy of Sciences of the United States of America. 92 (8): 3626–30. Bibcode:1995PNAS...92.3626O. doi:10.1073/pnas.92.8.3626. PMC 42220. PMID 7724609.
  10. ^ Moreno-Hernández S, Levitt M (June 2012). "Comparative modeling and protein-like features of hydrophobic-polar models on a two-dimensional lattice". Proteins. 80 (6): 1683–93. doi:10.1002/prot.24067. PMC 3348970. PMID 22411636.
  11. ^ Socci ND, Onuchic JN (1994-07-15). "Folding kinetics of proteinlike heteropolymers". The Journal of Chemical Physics. 101 (2): 1519–1528. arXiv:cond-mat/9404001. doi:10.1063/1.467775. ISSN 0021-9606. S2CID 10672674.
  12. ^ Fiebig KM, Dill KA (1993-02-15). "Protein core assembly processes". The Journal of Chemical Physics. 98 (4): 3475–3487. doi:10.1063/1.464068.
  13. ^ Jiang M, Zhu B (February 2005). "Protein folding on the hexagonal lattice in the HP model". Journal of Bioinformatics and Computational Biology. 3 (1): 19–34. doi:10.1142/S0219720005000850. PMID 15751110.
  14. ^ Shaw D, Shohidull Islam AS, Sohel Rahman M, Hasan M (2014-01-24). "Protein folding in HP model on hexagonal lattices with diagonals". BMC Bioinformatics. 15 Suppl 2 (2): S7. doi:10.1186/1471-2105-15-S2-S7. PMC 4016602. PMID 24564789.
  15. ^ Backofen R, Will S, Bornberg-Bauer E (March 1999). "Application of constraint programming techniques for structure prediction of lattice proteins with extended alphabets". Bioinformatics. 15 (3): 234–42. doi:10.1093/bioinformatics/15.3.234. PMID 10222411.
  16. ^ Crippen GM (April 1991). "Prediction of protein folding from amino acid sequence over discrete conformation spaces". Biochemistry. 30 (17): 4232–7. doi:10.1021/bi00231a018. PMID 2021616.
  17. ^ Dill KA, Bromberg S, Yue K, Fiebig KM, Yee DP, Thomas PD, Chan HS (April 1995). "Principles of protein folding--a perspective from simple exact models". Protein Science. 4 (4): 561–602. doi:10.1002/pro.5560040401. PMC 2143098. PMID 7613459.