단백질 스플라이싱

Protein splicing
mechanism of protein splicing involving inteins
정수를 포함하는 단백질 스플리싱의 메커니즘. 이 방법에서 N-extein은 빨간색으로, 정수(검은색), C-extein은 파란색으로 표시된다. X는 산소 또는 황 원자를 나타낸다.

단백질 스플리싱은 양쪽에 C-단자N-단자외부단백질(extein)의 교합으로 내부단백질(internal sublicing)이 전구단백질에서 제거되는 특정단백질의 근육내 반응이다. 전구단백질의 스플리싱 접합부는 주로 시스테인이나 세린으로, 핵소피성 사이드 체인을 함유한 아미노산이다. 현재 알려진 단백질 스플리싱 반응은 아데노신 트리인산염(ATP)이나 구아노신 트리인산염(GTP)과 같은 외생적인 공작용제나 에너지원을 필요로 하지 않는다. 일반적으로 스플리싱은 사전 mRNA 스플리싱과만 관련이 있다. 이 전구 단백질은 세 개의 세그먼트를 포함한다. N-extein 그 다음에 정수 그리고 C-extein. 스플라이싱이 이루어진 후, 그 결과 단백질은 C-extein과 연결된 N-extein을 함유하고 있다. 이 스플리싱 제품은 엑스테인이라고도 불린다.

역사

첫 번째 정수는 1988년 Neurospora crassa[1] 당근[2] vacuolar ATPase(정수 없음)와 putative calcium 이온 전달체로 처음 설명되었던 효모(정수 포함)의 동질유전자의 시퀀스 비교를 통해 발견되었다.[3] 1990년에 히라타 외 연구진은 효모 유전자의 여분의 염기서열이 mRNA로 변환되어 번역 후에야 숙주 단백질에서 제거된다는 것을 증명했다.[4] 그 이후로, 정수는 생명의 세 영역(유핵생물, 박테리아, 고고학)과 바이러스에서 모두 발견되었다.

단백질 스플라이싱은 예상치 못한 일이었고 그 메커니즘은 1990년에 두 그룹(안라쿠와[6] 스티븐스)에 의해 발견되었다. 그들은 둘 다 황색 H-ATPase+ 효소의 전구체에서 사카로마이오스 세레비시아에 VMA1을 발견했다. N-와 C-termini의 아미노산 염기서열은 다른 유기체로부터 나온 vacuolar H-ATPase의+ 염기서열 70%에 해당하는 반면, 중앙 위치의 아미노산 염기서열은 효모 HO 누클리스의 총 DNA 염기서열의 30%에 해당한다.

많은 유전자들은 서로 다른 위치에 삽입된 관계없는 정인코딩 세그먼트를 가지고 있다. 이런 저런 이유로 정수(또는 정수를 위해 코딩하는 유전자 세그먼트)를 이기적인 유전원소라고 부르기도 하지만 기생이라고 부르는 것이 더 정확할 수도 있다. 진화에 대한 유전자 중심의 관점에 따르면, 대부분의 유전자들은 다른 유전자나 주장과 경쟁하는 한에서만 "이기적"이지만, 대개는 유기체의 기능을 수행하는 반면, 적어도 초기에는 "기생유전적 요소"가 유기체의 적합성에 긍정적인 기여를 하지는 않는다.[7] [8]

알려진 모든 정수([1])의 데이터베이스 내에서 113개의 알려진 정수가 최소 길이 138개의 아미노산과 최대 길이 844개의 아미노산을 가진 진핵생물에 존재한다. 첫 번째 정수는 Saccharomyces cerebisiae의 VMA 유전자 안에서 암호화되어 발견되었다. 그들은 나중에 곰팡이(ascomycetes, basidiomycetes, zygomycetes, chytrids)와 다양한 단백질에서도 발견되었다. 단백질을 포함한 알려진 정수와 멀리 관련이 있지만 메타조안 고슴도치 단백질과 밀접하게 관련이 있는 단백질은 글로머로미코타에서 정수 순서를 갖는 것으로 설명되어 왔다. 새롭게 묘사된 많은 정수들은 호밍 엔도뉴클레아제를 포함하고 있으며, 이들 중 일부는 분명히 활동적이다.[9] 곰팡이 속에 정수가 풍부하다는 것은 정수가 함유된 유전자의 측면 이전을 나타낸다. 에우박테리아와 고대에 있는 동안, 현재 알려진 정수는 289개와 182개가 있다. 놀랄 것도 없이, 에우박테리아와 고대의 대부분의 정수가 곰팡이처럼 핵산 대사 단백질에 삽입된 것으로 밝혀졌다.[9]

메커니즘

전구단백질 정수의 첫 번째 잔류물(세린, 트레오닌 또는 시스테인)의 사이드 체인이 즉시 상류에 있는 잔류물의 펩타이드 결합물(즉, N-extein의 최종 잔류물)을 공격하여 선형 에스테르(또는 티오에스터) 중간을 형성할 때 N-O 또는 N-S 시프트로 공정이 시작된다. C-extein의 첫 번째 잔류물의 측면 사슬이 N-단자 끝을 자유롭게 하기 위해 새로 형성된 (thio)ester를 공격할 때 transerstation이 발생한다. 이것은 비록 펩타이드 결합을 통해서는 아니지만, N-extein과 C-extein이 부착된 분기된 중간을 형성한다. 정수의 마지막 잔류물은 항상 아스파라긴이며, 이 사이드 체인의 아미드 질소 원자는 정수와 C-extein 사이의 펩타이드 결합을 갈라 단자 주기적 이미드와 함께 자유 정수 세그먼트를 형성한다. 마지막으로, C-extein의 자유 아미노 그룹은 이제 N-와 C-extein을 서로 연결하는 (thio)ester를 공격한다. O-N 또는 S-N 시프트는 펩타이드 결합과 기능, 결합 단백질을 생성한다.[10]

스플리싱 효과의 메커니즘은 자연적으로 일어나는 유추로서 고유 화학적 레깅스라고 불리는 중간 크기의 단백질을 화학적으로 생성하는 기법이다.

인틴

정수는 단백질을 스플라이싱하는 동안 자신을 배설하고 펩타이드 결합으로 남은 부분(엑스트인)을 결합할 수 있는 단백질의 한 부분이다.[11] 인틴은 또한 (RNA) 인트론과 유사하게 단백질 인트론이라고도 불린다.

명명 규칙

정수 이름의 첫 번째 부분은 그것이 발견된 유기체의 과학적 이름에 기초하고, 두 번째 부분은 해당 유전자 또는 엑스테인의 이름에 기초한다. 예를 들어 테르모플라즈마 산도필름에서 발견되고 VMA(Vacuolar ATPase subunit A)와 관련된 정수를 "Tac VMA"라고 부른다.

보통 이 예에서와 같이 유기체를 특정하는 데는 세 글자만 충분하지만, 변형이 있다. 예를 들어, 스트레인을 나타내기 위해 문자를 추가할 수 있다. 해당 유전자에 두 개 이상의 정수가 인코딩된 경우, 정수는 5㎛에서 3㎛ 또는 식별 순서(예: "MSM dnaB-1")로 숫자 접미사가 주어진다.

정수를 인코딩하는 유전자의 부분에는 보통 정수와 같은 이름이 붙지만, 혼동을 피하기 위해 정수의 명칭은 보통 자본화(예: Pfu RIR1-1)되는 반면, 해당 유전자 부분의 명칭은 이탤릭화(예: Pfu rir1-1)이다.

정수의 종류

스플리싱 단백질의 종류는 maxi-intein, mini-intein, trans-splicing inte, alanine intein의 네 종류로 분류된다. 맥시-인틴은 엔도누클레스 도메인을 포함하는 N- 및 C-단자 스플라이싱 도메인이다. 미니 정수는 대표적인 N-와 C-단자 스플라이싱 도메인이지만 엔도누클리스 도메인은 존재하지 않는다. 트랜스 스플링 정수의 경우, 정수는 두 개(또는 그 이상) 영역으로 분할되고, 그 다음에는 N-termini와 C-termini로 분할된다. 알라닌 정수는 시스틴이나 세린 대신 알라닌의 스플리싱 접합부를 가지고 있는데, 두 가지 모두 단백질 스플리싱이 발생한다.

풀 정수 및 미니 정수

인틴은 스플라이싱 도메인 외에 호밍 엔도누클리스 유전자(HEG) 도메인을 포함할 수 있다. 이 영역은 DNA를 동질 염색체의 무정수의 대립에서 분리함으로써 정수의 확산을 책임지고, DNA 이중 가닥 파손 수리(DSBR) 시스템을 촉발하여 그 틈을 수리함으로써 정수를 이전에 무정수로 복사하는 역할을 한다. HEG 도메인은 정수의 스플라이싱에 필요하지 않으므로 최소 또는 최소정수를 형성하여 손실될 수 있다. 여러 연구가 HEG 도메인을 추가하거나 제거하고 새로운 구조의 활동을 결정함으로써 정수의 모듈화 특성을 입증했다.[citation needed]

분할 정수

때로는 전구단백질의 정수가 두 개의 유전자에서 나온다. 이 경우 정수는 분할 정자라고 한다. 예를 들어, 시아노박테리아에서는 DNA 중합효소 III의 촉매 하위단위 α인 dnaEdna-ndna-c라는 두 개의 분리된 유전자에 의해 암호화된다. dnaE-n 제품은 N-extein 시퀀스에 이어 123-AA 정수 시퀀스로 구성되는 반면, dnaE-c 제품은 36-AA 정수 시퀀스에 이어 C-extein 시퀀스로 구성된다.[12]

생명공학분야의 응용

정수는 단백질 스플라이싱에 매우 효율적이며, 따라서 그들은 생명공학에서 중요한 역할을 발견했다. 현재까지 확인된 정수는 200개 이상이며, 크기는 100–800 AA이다. 정수는 단백질 반합성[13] 및 단백질 세그먼트의 선택적 라벨링과 같은 특정 용도에 맞게 설계되어 큰 단백질의 NMR 연구에 유용하다.[14]

약제 정수의 제약적 억제약물 개발에 유용한 도구가 될 수 있다. 정수를 함유한 단백질은 그 구조가 흐트러지기 때문에 정수가 배출되지 않으면 정상적인 기능을 수행하지 못한다.

예를 들어 유전자 치료에서, 정수는 일반적으로 미토콘드리아 게놈에 의해 인코딩되는 특정 고 소수성 단백질의 할당적 발현을 달성하는 데 유용할 수 있다고 제안되었다.[15] 이러한 단백질의 친수성은 미토콘드리아로의 수입에 장애물이다. 따라서 비수성 정수를 삽입하면 이 가져오기가 진행될 수 있다. 수입 후 정수를 분리하면 단백질이 야생형으로 복원된다.

친화력 태그는 불순물이 거의 없는 재조합 단백질을 축적할 수 있기 때문에 재조합 단백질을 정화하는 데 널리 사용되어 왔다. 단, 최종 정화 단계에서 단백질 보호에 의해 친화도 태그를 제거해야 한다. 여분의 단백질 분해 단계는 재조합 단백질에서 친화력 태그를 제거할 때 단백질 분해효소 특이성, 소화제 제거의 문제를 제기한다. 이 문제는 통제된 환경에서 자체 클리어 가능한 정수에 선호도 태그를 결합하여 방지할 수 있다. 이러한 종류의 1세대 표현 벡터는 수정된 사카로마이오스 세레비시아 VMA(Sce VMA) 정수를 사용했다. 정씨 [16] 바실러스 서큘란스의 CBD(Chitin Binding Domain)를 선호도 태그로 사용했으며, 이 태그를 수정된 Sce VMA 정수와 퓨전했다. 변형된 정수는 광범위한 pH 범위에 걸쳐 저온에서 1,4-디티오토트레이톨(DTT), β-메르카프토에탄올(β-ME) 또는 낭스틴과 연결된 N-단자 펩타이드 링크에서 자가 클리브 반응을 겪는다. 재조합 단백질을 발현한 후 세포 균질산은 치틴이 들어 있는 열을 통과한다. 이것은 치맥 단백질의 CBD가 기둥에 결합할 수 있게 한다. 나아가 온도가 낮아지고 위에서 설명한 분자가 기둥을 통과하면 치메르 단백질은 자가 분해되어 대상 단백질만 용출된다. 이 새로운 기법은 프로토롤리시스 스텝의 필요성을 없앴고, 수정된 Sce VMA는 CBD를 통해 키틴에 부착된 칼럼에 머무른다.[16]

최근에는 자가집합 펩타이드에 기초한 단백질을 정화하는 데 정수가 사용되고 있다. 엘라스틴과 같은 폴리펩타이드(ELP)는 생명공학에서 유용한 도구다. 대상 단백질과 융합되어 세포 안에서 골재를 형성하는 경향이 있다.[17] 이것은 단백질 정화에 필요한 크로마토그래피 단계를 제거한다. ELP 태그는 정수의 융합 단백질에 사용되어 크로마토그래피 없이 골재를 분리(원심분리)한 다음, 정수와 태그를 통제된 방식으로 분해하여 대상 단백질을 용액으로 방출할 수 있다. 이러한 단백질 격리는 연속적인 매체 흐름을 이용하여 이루어 질 수 있으며, 많은 양의 단백질을 산출할 수 있어, 이 과정은 기존의 방법보다 경제적으로 더 효율적이다.[17] 또 다른 연구자들은 표적 단백질을 분리하기 위해 더 작은 자체 집계 태그를 사용했다. 자가 분해 단백질을 형성하기 위해 작은 암페타닉 펩타이드 18A와 엘크16(그림 5)을 사용하였다.[18]

참고 항목

참조

  1. ^ Bowman, EJ; Tenney, K; Bowman, BJ (Oct 1988). "Isolation of genes encoding the Neurospora vacuolar ATPase. Analysis of vma-1 encoding the 67-kDa subunit reveals homology to other ATPases". J Biol Chem. 263 (28): 13994–4001. doi:10.1016/S0021-9258(18)68175-X. PMID 2971651.
  2. ^ Zimniak, L; Dittrich, P; Gogarten, JP; Kibak, H; Taiz, L (Jul 1988). "The cDNA sequence of the 69-kDa subunit of the carrot vacuolar H+-ATPase. Homology to the beta-chain of F0F1-ATPases". J Biol Chem. 263 (19): 9102–12. doi:10.1016/S0021-9258(19)76514-4. PMID 2897965.
  3. ^ Shih, CK; Wagner, R; Feinstein, S; Kanik-Ennulat, C; Neff, N (Aug 1988). "A dominant trifluoperazine resistance gene from Saccharomyces cerevisiae has homology with F0F1 ATP synthase and confers calcium-sensitive growth". Mol Cell Biol. 8 (8): 3094–103. doi:10.1128/mcb.8.8.3094. PMC 363536. PMID 2905423.
  4. ^ Hirata, R; Ohsumk, Y; Nakano, A; Kawasaki, H; Suzuki, K; Anraku, Y (Apr 1990). "Molecular structure of a gene, VMA1, encoding the catalytic subunit of H(+)-translocating adenosine triphosphatase from vacuolar membranes of Saccharomyces cerevisiae". J Biol Chem. 265 (12): 6726–33. doi:10.1016/S0021-9258(19)39210-5. PMID 2139027.
  5. ^ Hirata R, Ohsumk Y, Nakano A, Kawasaki H, Suzuki K, Anraku Y (April 1990). "Molecular structure of a gene, VMA1, encoding the catalytic subunit of H(+)-translocating adenosine triphosphatase from vacuolar membranes of Saccharomyces cerevisiae". J. Biol. Chem. 265 (12): 6726–33. doi:10.1016/S0021-9258(19)39210-5. PMID 2139027.
  6. ^ Kane PM, Yamashiro CT, Wolczyk DF, Neff N, Goebl M, Stevens TH (November 1990). "Protein splicing converts the yeast TFP1 gene product to the 69-kD subunit of the vacuolar H(+)-adenosine triphosphatase". Science. 250 (4981): 651–7. Bibcode:1990Sci...250..651K. doi:10.1126/science.2146742. PMID 2146742.
  7. ^ Swithers, Kristen S.; Soucy, Shannon M.; Gogarten, J. Peter (2012). "The Role of Reticulate Evolution in Creating Innovation and Complexity". International Journal of Evolutionary Biology. 2012: 1–10. doi:10.1155/2012/418964. ISSN 2090-8032. PMC 3403396. PMID 22844638.
  8. ^ Dawkins, Richard (1976). The Selfish Gene. Oxford University Press.
  9. ^ a b Perler, F. B. (2002). "InBase: the Intein Database". Nucleic Acids Research. 30 (1): 383–384. doi:10.1093/nar/30.1.383. ISSN 1362-4962. PMC 99080. PMID 11752343.
  10. ^ Noren CJ, Wang J, Perler FB (2000). "Dissecting the chemistry of protein splicing and its applications". Angew Chem Int Ed Engl. 39 (3): 450–66. doi:10.1002/(sici)1521-3773(20000204)39:3<450::aid-anie450>3.3.co;2-6. PMID 10671234.
  11. ^ Anraku, Y; Mizutani, R; Satow, Y (2005). "Protein splicing: its discovery and structural insight into novel chemical mechanisms". IUBMB Life. 57 (8): 563–74. doi:10.1080/15216540500215499. PMID 16118114.
  12. ^ Wu, H.; Hu, Z.; Liu, X. Q. (1998). "Protein trans-splicing by a split intein encoded in a split DnaE gene of Synechocystis sp. PCC6803". Proceedings of the National Academy of Sciences of the United States of America. 95 (16): 9226–9231. Bibcode:1998PNAS...95.9226W. doi:10.1073/pnas.95.16.9226. PMC 21320. PMID 9689062.
  13. ^ Schwarzer D, Cole PA (2005). "Protein semisynthesis and expressed protein ligation: chasing a protein's tail". Curr Opin Chem Biol. 9 (6): 561–9. doi:10.1016/j.cbpa.2005.09.018. PMID 16226484.
  14. ^ Muralidharan V, Muir TW (2006). "Protein ligation: an enabling technology for the biophysical analysis of proteins". Nat. Methods. 3 (6): 429–38. doi:10.1038/nmeth886. PMID 16721376. S2CID 12550693.
  15. ^ de Grey, Aubrey D.N.J (2000). "Mitochondrial gene therapy: an arena for the biomedical use of inteins". Trends in Biotechnology. 18 (9): 394–399. doi:10.1016/S0167-7799(00)01476-1. ISSN 0167-7799. PMID 10942964.
  16. ^ a b Chong, Shaorong; Mersha, Fana B; Comb, Donald G; Scott, Melissa E; Landry, David; Vence, Luis M; Perler, Francine B; Benner, Jack; Kucera, Rebecca B; Hirvonen, Christine A; Pelletier, John J; Paulus, Henry; Xu, Ming-Qun (1997). "Single-column purification of free recombinant proteins using a self-cleavable affinity tag derived from a protein splicing element". Gene. 192 (2): 271–281. doi:10.1016/S0378-1119(97)00105-4. ISSN 0378-1119. PMID 9224900.
  17. ^ a b Fong, Baley A; Wood, David W (2010). "Expression and purification of ELP-intein-tagged target proteins in high cell density E. coli fermentation". Microbial Cell Factories. 9 (1): 77. doi:10.1186/1475-2859-9-77. ISSN 1475-2859. PMC 2978133. PMID 20959011.
  18. ^ Xing, Lei; Wu, Wei; Zhou, Bihong; Lin, Zhanglin (2011). "Streamlined protein expression and purification using cleavable self-aggregating tags". Microbial Cell Factories. 10 (1): 42. doi:10.1186/1475-2859-10-42. ISSN 1475-2859. PMC 3124420. PMID 21631955.

추가 읽기

외부 링크