상승
HIKESHI상승 | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| |||||||||||||||||||||||||
식별자 | |||||||||||||||||||||||||
에일리어스 | RISKESHI, HSPC179, Riskeshi, L7RN6, OPI10, HSPC138, C11orf73, HLD13, 11번 염색체 공개 판독 프레임 73, Riskeshi, 열충격 단백질 핵인자, 열충격 단백질 수입인자 증가 | ||||||||||||||||||||||||
외부 ID | OMIM: 614908 MGI: 96738 HomoloGene: 6908 GenCard: RISKESHI | ||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
| |||||||||||||||||||||||||
맞춤법 | |||||||||||||||||||||||||
종. | 인간 | 마우스 | |||||||||||||||||||||||
엔트레즈 | |||||||||||||||||||||||||
앙상블 | |||||||||||||||||||||||||
유니프로트 | |||||||||||||||||||||||||
RefSeq(mRNA) | |||||||||||||||||||||||||
RefSeq(단백질) | |||||||||||||||||||||||||
장소(UCSC) | Chr 11: 86.3 ~86.35 Mb | Chr 7: 89.57 ~89.59 Mb | |||||||||||||||||||||||
PubMed 검색 | [3] | [4] | |||||||||||||||||||||||
위키데이터 | |||||||||||||||||||||||||
|
HISKESHI는 폐와 다세포 생물 발달에[5] 중요한 단백질로 인간의 경우 HISKESHI [6]유전자에 의해 암호화됩니다.HISKESHI는 사람의 경우 11번 염색체에서, 쥐의 경우 7번 염색체에서 발견된다.유사한 배열(정통어)은 대부분의 동물과 곰팡이 종에서 발견된다.7번 Rinchik 6번 염색체 단백질의 생쥐 상동성 치사 유전자는 l7Rn6 [7]유전자에 의해 암호화된다.
진
HIMKESHI는 호모 사피엔스의 단백질 코드 유전자이다.이 유전자의 다른 이름은 FLJ43020, HSPC138, HSPC179 및 L7RN6이다. 염색체 11의 긴 팔의 영역 q14.2에 위치하며, 인트론 및 엑손을 포함한 전체 유전자는 플러스 가닥에 42,698개의 염기쌍이다.RISKESHI Variant 1의 mRNA에는 1, 3, 4, 5, 및 7이 포함되며, 베이스 페어 239 ~832는 부호화 영역을 나타냅니다.
대체 스플라이싱
변종 1은 가장 길고 일반적인 단백질 코드 변종이다.다른 세 가지 주요 변형은 판독 프레임을 벗어나 mRNA 시퀀스의 조기 종료를 유발하고 단백질 붕괴를 겪는 대체 엑손 시퀀스를 사용합니다.다음 표는 다양한 변종과 Exon 사용법을 보여줍니다.
변종 | 엑손 1 | 엑손 2 | 엑손 3 | 엑손 4 | 엑손 5 | 엑손 6 | 엑손 7 | 단백질 코딩 |
---|---|---|---|---|---|---|---|---|
1 | x | x | x | x | x | 네. | ||
2 | x | x | x | x | x | x | 아니요. | |
3 | x | x | x | x | x | 아니요. | ||
4 | x | x | x | x | 아니요. |
위의 표에 나타난 네 가지 변종은 인간의 세포에서 발견되는 가장 일반적인 동질 형태입니다.총 13개의 대체 스플라이스된 시퀀스와 두 개의 대체 프로모터를 사용하는 3개의 비스플라이스된 형식이 있습니다.mRNA 변형은 8개의 서로 다른 엑손, 교대 엑손, 중복 엑손 및 인트론의 보유 조합에 따라 다르다.대체 스플라이싱 외에 mRNA는 3' 끝의 절단에 따라 다르다.변종 1은 단백질을 코드하는 것으로 나타난 10개의 mRNA 중 하나이며, 나머지는 무의미한 매개 mRNA 붕괴와 관련이 있는 것으로 보인다.C11orf73 isoforms의 AceView[8] 표현
주최자
프로모터 영역인 GXP 47146은 Genomatix의 ElDorado[9] 도구를 사용하여 발견되었습니다.840 bp 배열은 86012753~86013592의 DNA 지점에서 RISKESHI 유전자 앞에 위치한다.프로모터는 12개의 맞춤법 중 12개의 코드로 보존되며 6개의 관련 대화록에 사용됩니다.
Genomatix ElDorado 도구의 보존된 전사인자 결합 부위:
패밀리 상세 정보 | 부터 | 로. | 앵커. | 오리엔테이션 | 무스쿨루스 보존 | 매트릭스 심 | 순서 | 발생. |
---|---|---|---|---|---|---|---|---|
Cell Cycle Regulators : Cell Cycle 호몰로지 요소 | 137 | 149 | 143 | + 가닥 | 보존된 | 0.943 | gacTTGAattca | 1 |
GATA 결합 계수 | 172 | 184 | 178 | + 가닥 | 보존된 | 0.946 | 타아게토그 | 1 |
척추동물TATA결합단백질인자 | 193 | 209 | 201 | + 가닥 | 보존된 | 0.983 | tctaTAAAattgat | 1 |
히트 쇼크 계수 | 291 | 315 | 303 | + 가닥 | 보존된 | 0.992 | 카카가아크릿AGAAgcatctt | 4 |
인간과 쥐의 ETS1 요인 | 512 | 532 | 522 | + 가닥 | 보존된 | 0.984 | taagcc GGA gtact tgtt | 3 |
아연 핑거 전사인자 RU49, Zipro1 | 522 | 528 | 525 | + 가닥 | 보존된 | 0.989 | aAGTACT | 2 |
Krueppel과 같은 전사 인자 | 618 | 634 | 626 | + 가닥 | 보존된 | 0.925 | tgggggg카카치 | 1 |
SOX/SRY-sex/testis 결정 및 HMG 박스 요인 | 636 | 658 | 647 | + 가닥 | 보존된 | 0.925 | cccgcaAATTGGaagttt | 1 |
종료
mRNA 생성물의 종단은 유전자의 cDNA 내에서 부호화된다.mRNA 제품의 종단에는 일반적으로 폴리 A 신호, 폴리 A 테일 및 스템 루프 구조를 형성할 수 있는 시퀀스 영역의 3가지 주요 특징이 있습니다.폴리 A 신호는 보존도가 높은 6개의 뉴클레오티드 긴 염기서열이다.진핵생물에서 배열은 AATAAA이며 폴리 A 부위에서 약 10-30개의 뉴클레오티드가 위치한다.AATAAA 배열은 고도로 보존된 진핵생물 폴리A 신호로 신호 배열 후 mRNA 생성물 10-30 염기쌍의 폴리아데닐화를 위한 신호이다.C11orf73의 polyA 부위는 GTA입니다.
유전자 발현
RISKESHI는 평균의 2.3배라는 높은 수준에서 보편적으로 발현되는 것으로 결정되었다.C11orf73은 많은 인체 조직에서 [10][11]발현된다.발현 프로파일과 UniGene의 EST 프로파일 사이에서 11개 조직만이 C11orf73을 발현하지 않는 것으로 나타났으며, 이는 조직 내 샘플 크기가 작기 때문일 가능성이 높다.
단백질
인간의 HIKESHI 유전자는 특성화되지 않은 단백질 [6]C11orf73이라고 불리는 단백질을 암호화한다.상동 마우스 L7rn6 유전자는 7번 Rinchik [7]6번 염색체에 치사 유전자라고 불리는 단백질을 암호화한다.
1 mfgclvagrl vqtaqvae dkftaqdlpdy esinhvvfm lgtippegm ggsvyfsypd 61 sngmpvwl gftngkpsa ifkglsg egsqhpgg nivlveldsa igvellds 121 maqtpvellds 121 maqtpqtpqtpveld.
암호화된 인간 단백질은 197개의 아미노산 길이에 21,628개의 무게가 나간다.마우스 단백질과 유추하여 인간 HIKESHI 단백질의 가상의 기능은 폐세포 [5]내 분비기구의 조직과 기능이다.
기능불명단백질(DUF775) | |||||||||
---|---|---|---|---|---|---|---|---|---|
식별자 | |||||||||
기호. | DUF775 | ||||||||
팜 | PF05603 | ||||||||
인터프로 | IPR008493 | ||||||||
|
DUF775(Domain of Unknown Function 775)로 알려진 단백질 도메인은 사람 HIKESHI 및 마우스 L7rn6 단백질에 모두 위치합니다.DUF775 도메인은 197개의 아미노산 길이로 단백질과 같은 길이입니다.정의상 DUF 775 슈퍼 패밀리를 구성하는 다른 단백질은 C11orf73의 모든 맞춤법을 포함한다.
수경 분석 결과 단백질에는 광범위한 소수성 영역이 없으므로 HIKESHI는 세포질 단백질로 결론지어진다.C11orf73의 등전점은 5.18로 산성 환경에서 최적으로 기능함을 나타냅니다.
SNP
C11orf73 배열에 대한 유일한 SNP,[13] 즉 단일 뉴클레오티드 다형성은 단백질 내에서 아미노산 변화를 일으킨다.다른 SNP의 부족은 아마도 높은 수준의 HIKESHI 보존과 단백질의 돌연변이가 유기체에 주는 치명적인 영향 때문일 것이다.SNP의 표현형을 알 수 없습니다.
기능. | dbSNP Alle | 단백질 잔류물 | 코돈 포지션 | 아미노산 위치 |
---|---|---|---|---|
언급 | C | 프롤린 [P] | 1 | 47 |
미센스 | G | 알라닌[A] | 1 | 47 |
진 근린
RIKESHI의 주변 유전자는 CCDC81, ME3, EED입니다.주변 유전자의 기능을 살펴봄으로써 유전자의 가능한 기능을 더 잘 이해하기 위해 유전자 주변을 살펴본다.
CCDC81 유전자는 특성화되지 않은 단백질 생성물을 코드하며 플러스 가닥을 지향한다.CCDC81은 81개의 isoform 1을 포함하는 코일 코일 도메인을 나타낸다.
ME3 유전자는 미토콘드리아 말릭 효소 3 전구체를 의미한다.사과산 효소는 NAD+ 또는 NADP+를 보조 인자로 사용하여 피루브산에 대한 사과산염의 산화적 탈탄산화를 촉매한다.포유류의 조직에는 세포질 NADP(+)의존성 이소형, 미토콘드리아 NADP(+)의존성 이소형, 미토콘드리아 NAD(+)의존성 이소형 등 3가지 다른 동소형태를 포함한다.이 유전자는 미토콘드리아 NADP(+)-의존성 아이소폼을 암호화한다.이 유전자에 대해 복수의 대체 스플라이스 전사 변형이 발견되었지만, 일부 변종의 생물학적 타당성은 [15]결정되지 않았다.
EED 유전자는 배아 외배엽 발달 아이소폼 b의 약자로 폴리콤 그룹(PcG)의 구성원이다.PcG 패밀리는 다량체 단백질 복합체를 형성하며, 연속적인 세포 생성에 걸쳐 유전자의 전사 억제 상태를 유지하는 데 관여합니다.이 단백질은 제스테2의 강화제, 인테그린 베타7의 세포질 꼬리, 면역 결핍 바이러스 타입 1(HIV-1) MA 단백질 및 히스톤 탈아세틸화효소 단백질과 상호작용합니다.이 단백질은 히스톤 탈아세틸화를 통해 유전자 활성의 억제를 매개하며 인테그린 기능의 특정 조절자 역할을 할 수 있습니다.이 [16]유전자에 대해 별개의 등형질을 코드하는 두 가지 전사 변형이 확인되었다.
상호 작용
STRING과[17] Sigma-Aldrich의 Favorite[18] Gene 프로그램은 C11orf73과의 단백질 상호작용 가능성을 시사했다.ARGUL1, CRHBP 및 EED는 텍스트마이닝에서 파생되었으며 HNF4A는 Sigma-Aldrich에서 파생되었습니다.
단백질 | 묘사 | 방법 | 스코어 |
---|---|---|---|
아르구루 1 | 알 수 없는 | 텍스트 마이닝 | 0.712 |
CRHBP | 코르티코트로핀 방출 호르몬 결합 단백질 | 텍스트 마이닝 | 0.653 |
EED | 배아외배엽발달 | 텍스트 마이닝 | 0.420 |
HNF4A | 전사 조절기 | 시그마알드리히 | 없음 |
ARGUL1은 미지의 기능을 가진 미지의 단백질이다.CRHBP는 HIKESHI를 포함하거나 활성화하는 신호 캐스케이드에서 역할을 할 수 있는 코르티코트로핀 방출 호르몬 결합 단백질이다.PcG 패밀리는 다량체 단백질 복합체를 형성하며, 연속적인 세포 생성에 걸쳐 유전자의 전사 억제 상태를 유지하는 데 관여합니다.HNF4A는 전사조절제이며 HNF4A가 C11orf73의 발현을 조절하는지 또는 단순히 [12C11orf73과 상호작용하는지는 알려져 있지 않다.
진화적 역사
유기체의 진화 역사는 계통수를 만들기 위한 시간 기준으로서 맞춤법의 순서를 사용하여 결정될 수 있다.CLUSTALW는[19] 여러 시퀀스를 비교하며, 이 프로그램을 사용하여 C11orf73의 맞춤법에 기반한 계통수를 만들 수도 있습니다.오른쪽에 있는 트리는 생성된 계통수를 발산 시간에 따른 시간 선으로 보여줍니다.HIKESHI 철자로 만들어진 나무는 문헌 계통수와 동일하며, 심지어 물고기, 조류, 곰팡이와 같은 유사한 유기체를 함께 묶기도 한다.
맞춤법
상동성 염기서열은 종분화 현상에 의해 분리되면 직교한다: 종이 두 개의 분리된 종으로 분리될 때, 그 결과 종에서 단일 유전자의 발산된 복사는 직교라고 한다.직교 유전자 또는 직교 유전자는 같은 조상에서 유래했기 때문에 서로 비슷한 다른 종의 유전자이다.직교 배열은 분류학적 분류와 유기체의 계통학 연구에 유용한 정보를 제공한다.유전적 발산 패턴은 유기체의 연관성을 추적하는 데 사용될 수 있다.매우 밀접하게 관련되어 있는 두 유기체는 두 개의 맞춤법 사이에서 매우 유사한 DNA 서열을 나타낼 가능성이 있습니다.반대로, 다른 유기체로부터 진화적으로 더 멀리 떨어져 있는 유기체는 연구되고 있는 맞춤법의 순서에서 더 큰 차이를 보일 가능성이 있다.
11번 염색체 표 열린 판독 프레임 73 맞춤법
종. | 공통명 | 단백질명 | 등록 번호 | NT 길이 | NT 아이덴티티 | AA 길이 | AA 아이덴티티 | E-Value |
---|---|---|---|---|---|---|---|---|
호모 사피엔스 | 인간 | C11orf73 | NM_016401 | 1187 bp | 100% | 197 aa | 100% | 0 |
봉타우루스 | 소. | LOC504867 | NP_001029398 | 996 bp | 73.60% | 197 aa | 98% | 5.30E-84 |
근골근 | 마우스 | l7Rn6 | NP_080580 | 1045 bp | 72.90% | 197 aa | 97% | 4.80E-83 |
담쟁이덩굴 | 치킨. | LOC427034 | 없음 | 851 bp | 56.20% | 197 aa | 88.3% | 5.60E-76 |
태니오피기아구타타타 | 제브라 핀치 | LOC100190155 | ACH44077 | 997 bp | 61.60% | 997 aa | 87.80% | 1.20E-75 |
라에비스이노푸스 | 개구리 | MGC80709 | NP_001087012 | 2037 bp | 36.50% | 197 aa | 86.80% | 1.70E-75 |
오코린쿠스 마이키스 | 레인보우 트라우트 | CK073 | NP_001158574 | 940 bp | 52.20% | 197 aa | 75.10% | 2.70E-66 |
테트라돈니그로비리디스 | 테트라돈 | 무기명 단백질 제품 | CAF89643 | 없음 | 없음 | 197 aa | 70.90% | 1.40E-61 |
트리코플락스 아드헤렌스 | 트리코플락스 아드헤렌스 | 트라이애드래프트_19969 | XP_002108733 | 600 bp | 33.10% | 199 aa | 52.30% | 2.00E-47 |
쿠렉스쿠인쿠에파시아투스 | 모기 | 보존가정단백질 | XP_001843282 | 594 bp | 30.70% | 197 aa | 49.30% | 2.50E-41 |
드로소필리아멜라노가스터 | 날다 | CG13926 | NP_647633 | 594 bp | 31.50% | 197 aa | 48.50% | 4.50E-39 |
라카리아 바이컬러 | 버섯 | 예측단백질 | XP_001878996 | 696 bp | 36.40% | 202 aa | 35.20% | 8.30E-24 |
칸디다 알비칸스 | 곰팡이 | CaO19.13758 | XP_716157 | 666 bp | 36.10% | 221 aa | 24% | 5.70E-11 |
이 표는 단백질 이름, 가입 번호, 뉴클레오티드 동일성, 단백질 동일성 및 E-값과 함께 13개의 배열(12개의 정형어, 1개의 원본 배열)을 보여준다.등록 번호는 NCBI 단백질 데이터베이스의 식별 번호입니다.뉴클레오티드 배열은 DBSOURCE의 단백질 배열 페이지에서 접근할 수 있으며, 이것은 가입 번호를 제공하고 뉴클레오티드의 배열 페이지로 연결되는 링크입니다.각 정형외과 및 각 유기체에 대한 뉴클레오티드와 단백질 배열의 길이도 표에 나열되어 있다.배열 길이 옆에는 원래의 HIKESHI 유전자에 대한 맞춤법의 동일성이 있다.ID와 E 값은 SDSC Biology Workbench의 ALIGN과 NCBI의 BLAST를 사용하여 글로벌 얼라인먼트 프로그램 ALIGN을 사용하여 획득했습니다.
그래프는 거의 선형 곡선을 만들기 위해 유기체의 발산 시간에 대한 맞춤법의 백분율 동일성을 보여줍니다.곡선의 두 개의 주요 관절은 각각 약 4억 5천만 년과 1억 5천만 년 전의 유전자 복제 시기를 암시합니다.유전자 복제에 의한 패럴로그는 아마도 고도로 보존된 HIKESHI의 직교와 너무 달라서 Blink 또는 BLAST 도구를 사용하여 발견되지 않았다.
n의 보정값(템플릿 배열과의 아미노산 차이수)인 m(100 아미노산 세그먼트에서 발생한 총 아미노산 변화수)도 δ(연간 평균 아미노산 변화수, 보통 δE9 값으로 표현)를 계산하는데 사용된다.
m/100 = –ln(1-n/100) † = (m/100)/(2*T)
레퍼런스
- ^ a b c GRCh38: 앙상블 릴리즈 89: ENSG00000149196 - 앙상블, 2017년 5월
- ^ a b c GRCm38: 앙상블 릴리즈 89: ENSMUSG000062797 - 앙상블, 2017년 5월
- ^ "Human PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ "Mouse PubMed Reference:". National Center for Biotechnology Information, U.S. National Library of Medicine.
- ^ a b Fernández-Valdivia R, Zhang Y, Pai S, Metzker ML, Schumacher A (January 2006). "l7Rn6 Encodes a Novel Protein Required for Clara Cell Function in Mouse Lung Development". Genetics. 172 (1): 389–99. doi:10.1534/genetics.105.048736. PMC 1456166. PMID 16157679.
- ^ a b Zhang QH, Ye M, Wu XY, Ren SX, Zhao M, Zhao CJ, Fu G, Shen Y, Fan HY, Lu G, Zhong M, Xu XR, Han ZG, Zhang JW, Tao J, Huang QH, Zhou J, Hu GX, Gu J, Chen SJ, Chen Z (October 2000). "Cloning and Functional Analysis of cDNAs with Open Reading Frames for 300 Previously Undefined Genes Expressed in CD34+ Hematopoietic Stem/Progenitor Cells". Genome Res. 10 (10): 1546–60. doi:10.1101/gr.140200. PMC 310934. PMID 11042152.
- ^ a b Rinchik EM, Carpenter DA (1993). "N-ethyl-N-nitrosourea-induced prenatally lethal mutations define at least two complementation groups within the embryonic ectoderm development (eed) locus in mouse chromosome 7". Mamm. Genome. 4 (7): 349–53. doi:10.1007/BF00360583. PMID 8358168. S2CID 24689449.
- ^ AceViewNCBI 유전자 정보 AceView 2006년 4월 7일 WebCite에서 아카이브 완료
- ^ 프로모터 분석용 Genomatix ElDorade 도구 ElDorado 제품 페이지 2008년 10월 6일 Wayback Machine에 보관
- ^ "Expression profile for C11orf73". GeneNote version 2.4. Weizmann Institute of Science. September 2009. Archived from the original on 2012-03-05. Retrieved 2010-03-27.
- ^ "EST Profile - Hs.283322". National Center for Biotechnology Information, United States National Library of Medicine.
- ^ Saier Lab 생물정보학 그룹 http://www.tcdb.org/progs/hydro.php
- ^ NcBI SNP Database https://www.ncbi.nlm.nih.gov/snp/ 2006년 1월 26일 WebCite에서 아카이브
- ^ NCBI Entrez https://www.ncbi.nlm.nih.gov/nuccore/NC_000011.9?from=86011067&to=86059171&report=graph
- ^ RefSeq NCBI Database https://www.ncbi.nlm.nih.gov/RefSeq/ 2006년 3월 30일 WebCite 아카이브
- ^ "RefSeq: NCBI Reference Sequence Database".
- ^ STRING (상호작용 유전자/단백질 검색 도구) http://string-db.org/ 2010년 7월 23일 WebCite 아카이브
- ^ Sigma-Aldrich가 가장 좋아하는 유전자 http://www.sigmaaldrich.com/life-science/your-favorite-gene-search.html
- ^ CLUSTALW 프로그램 Julie D.톰슨, 데스몬드 GHiggins and Toby J. Gibson http://workbench.sdsc.edu/ 2006년 3월 30일 WebCite에서 아카이브
외부 링크
- UCSC Genome Browser의 인간 C11orf73 게놈 위치 및 C11orf73 유전자 세부 정보 페이지.