CJK 통합이상형
CJK Unified Ideographs
중국어, 일본어, 한국어(CJK) 스크립트는 CJK 문자로 통칭되는 공통 배경을 공유합니다.한(韓)통일이라는 과정에서 공통(공유)자를 확인하여 CJK 통일사상이라고 명명하였습니다.유니코드 15.1 기준으로 유니코드는 총 97,[1]680개의 문자를 정의하고 있습니다.
중국어 대본이 관념적이 아니라 기록적이기 때문에 관념적이라는 용어는 잘못된 이름입니다.
20세기 초까지 베트남에서도 한자(Chữ Nom)를 사용했기 때문에 CJKV라는 약칭을 사용하기도 합니다.
원천
이데올로기 연구 그룹(Ideographic Research Group, IRG)은 CJK 통합 이데올로기의 인코딩된 레퍼토리에 대한 확장을 개발하는 역할을 맡고 있습니다.IRG는 회원국들이 제출한 새로운 CJK 통일사상에 대한 제안서를 처리하며, 수차례의 전문가 검토를 거친 후, 통합문자 집합을 ISO/IEC JTC 1/SC 2 Working Group 2 (WG2) 및 Unicode Technical Committee (UTC)에 제출하여 ISO/IEC 10646 및 Unicode 표준에 포함할 것을 고려하고 있습니다.다음 IRG 회원국들은 CJK 통일된 단체들의 표준화에 관련되어 있습니다.
UTC와 영국이 제출한 표식은 특정 지역에 특정한 것이 아니라 개별 전문가들이 부호화를 위해 제안한 문자입니다.SAT 다이조쿄 텍스트 데이터베이스에는 SAT가 제출한 표식이 필요합니다.
아래 표는 유니코드 15.[2]0의 각 IRG 소스에 대한 인코딩된 CJK 통합 아이디얼의 수를 보여줍니다.다수의 문자가 하나 이상의 소스를 가지고 있기 때문에 전체 문자 수(223,653개)는 인코딩된 CJK 통합 아이디얼 수(97,058개)를 훨씬 초과합니다.
| 국가 또는 지역 | 문자수 |
|---|---|
| 66,563 | |
| 17,654 | |
| 344 | |
| 58,601 | |
| 16,148 | |
| 20,739 | |
| 23,975 | |
| 13,284 | |
| 2,503 | |
| 앉았다 | 3,455 |
| UTC | 1,020 |
| 총 | 224,286 |
UTC출처
UTC가 IRG에 제출한 대부분의 문자는 유니코드 기술 위원회([3]UTC) 문서에서 파생된 것입니다.다른 출처는 다음과 같습니다.
- 존 드프란시스의 ABC 중영사전
- Adobe-CNS1 글리프 컬렉션
- Adobe-Japan1 글리프 컬렉션
- 중국 조류의 종과 아종에 대한 완전한 체크리스트(中国鸟类系统检索)中国鸟类系统检索
- 대명사전 (Dại Tự Dể Chữ Nom)
- 슈원지 주석(an文之 ()(an文之not)
- GB18030-2000
- 예수 그리스도 후기 성도 교회에서 제공하는 필수 캐릭터 목록(홍콩)
- 신상업사전(新商業典), 홍콩
- 중국사회과학원, 언어연구소, 사전편집실의 현대중국어사전(1984)
- 작업 그룹(WG2) 문서
- Wenlin (사진) http://www.wenlin.com/
CJK 통합 한자 블록
CJK 통합이상형
기본블록 이름은 CJK 통합아이디어그래프(4E00-9)FFF)에는 U+4E00 ~ U+9FF 범위의 기본 한자 20,992자가 포함되어 있습니다.이 블록에는 중국 문자 체계에서 사용되는 문자뿐만 아니라 일본 문자 체계에서 사용되는 한자, 한국의 한자, 베트남어의 쵸놈 문자도 포함되어 있습니다.이 블록의 많은 문자가 세 개의 쓰기 시스템 모두에 사용되는 반면 다른 문자는 세 개 중 하나 또는 두 개에만 사용됩니다.블록의 첫 번째 20,902자는 급진파의 강시 사전 순서에 따라 배열됩니다.이 시스템에서는 획 수가 가장 적은 문자가 먼저 나열됩니다.나머지 캐릭터는 나중에 추가된 것으로, 급진적인 순서가 아닙니다.
그 차단은 동아시아 [5]내에서 다소 논란이 되었던 한 통일의 [4]결과입니다.중국어, 일본어, 한국어 문자가 같은 위치에서 코딩되었기 때문에 선택된 글리프의 모양은 사용되는 특정 글꼴에 따라 달라질 수 있습니다.그러나 소스 구분 규칙에 따르면 이전 문자 집합에서 별도로 인코딩된 문자는 새 유니코드 [6]인코딩에서 별도로 유지됩니다.
변이 선택기를 사용하면 유니코드 [7]내에서 특정 변이 CJK 이데오그램을 지정할 수 있습니다.Adobe-Japan1 문자 집합은 14,684개의 변형 [8]순서를 가지고 있으며 변형 [9]선택기를 사용하는 극단적인 예입니다.
차트
4E00-62FF, 6300-77FF, 7800-8CFF, 8D00-9FF
원천
참고: 대부분의 문자는 여러 출처에 나타나므로 개별 문자 수의 합(102,795)이 인코딩된 문자 수(20,992)[10]보다 훨씬 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| G0 | GB 2312-80 | 6,763 | 20,933 | |
| G1 | GB 12345-90 | 2,202 | ||
| G3 | GB 7589-87 전통 양식 | 4,834 | ||
| G5 | GB 7590-87 전통적인 | 2,841 | ||
| G7 | 현대 한자 일반문자도 (간체 중국어: 现代汉语通用字表) | 42 | ||
| G8 | GB 8565-88 | 199 | ||
| GCE | 국립교육과학원 | 4 | ||
| 지디엠 | 중화인민공화국 공안부 공안국의 지명 문자 | 2 | ||
| GE | GB16500-95 | 3,772 | ||
| GFC | 현대 중국 표준 사전 (现代汉语规范词典第二版) | 2 | ||
| GGFZ | 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () | 1 | ||
| GH | GB/T 15564-1995 | 59 | ||
| GHZ | 하뉴 다지디안 (漢語大字典)漢語大字典 han) | 1 | ||
| GHZR | 하뉴 다지디안 2판.(汉语大字典, 第二版) | 1 | ||
| GK | GB 12052-89 | 89 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 16 | ||
| GKX | 강희사전(康熙典) | 3 | ||
| GLK | 룽칸쇼우젠 (龍龍龕手鑑 () | 1 | ||
| 지티 | 표준 전신 법규집 (개정), 1983 | 8 | ||
| 지유 | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 92 | ||
| GZFY | 하뉴 팡옌 다치디언 (汉语方言大词典) | 1 | ||
| H | 홍콩 보조 캐릭터 세트, 2008 | 2,292 | 15,376 | |
| HB0 | 컴퓨터 중국어 글리프와 문자 코드 매핑 테이블, 기술 보고서 C-26 (電腦用中文字型與字碼對照表, 技術通報C-26) | 9 | ||
| HB1 | 빅5, 레벨 1 | 5,401 | ||
| HB2 | 빅5, 레벨2 | 7,650 | ||
| HD | 홍콩 보조 캐릭터 세트, 2016 | 24 | ||
| J0 | JIS X 0208-1990 | 6,356 | 12,565 | |
| J1 | JIS X 0212-1990 | 3,058 | ||
| J13 | JIS X 0213: 2004 레벨 3 문자가 J1 문자를 대체한다. | 1,037 | ||
| J13A | JIS X 0213:2004 level-3 문자 부록 JIS X 0213:2000 level-3이 J1 문자를 대체합니다. | 2 | ||
| J14 | JIS X 0213: 2004 레벨 4 문자가 J1 문자를 대체한다. | 1,704 | ||
| J3 | JIS X 0213:2004 레벨 3 | 95 | ||
| J3A | JIS X 0213:2004 레벨 3 부록 | 7 | ||
| J4 | JIS X 0213:2004 레벨 4 | 301 | ||
| JARIB | ARIB STD-B24 | 3 | ||
| JMJ | 전자정부 "모지조호-기반 프로젝트" 캐릭터 정보 개발 및 정비 사업 (文字情報基盤整備事業) | 2 | ||
| K0 | KS C 5601-87 (현 KS X 1001:2004) | 4,620 | 15,442 | |
| K1 | KS C 5657-91 (현 KS X 1002:2001) | 2,855 | ||
| K2 | PKS C 5700-1:1994 | 7,911 | ||
| K3 | PKS C 5700-2:1994 | 1 | ||
| K4 | PKS 5700-3:1998 | 4 | ||
| K6 | KS X 1027-5:2014 | 49 | ||
| KC | 한국사 온라인(韓國史 On-line) | 1 | ||
| KU | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 1 | ||
| KP0 | KPS 9566-97 | 4,652 | 15,010 | |
| KP1 | KPS 10721-2000 | 10,358 | ||
| 엄마. | HKSCS-2008 | 29 | 200 | |
| MB1 | 빅 파이브 | 10 | ||
| MB2 | 빅 파이브 | 7 | ||
| MC를 | MCSCS 참조 | 3 | ||
| MD | MCSCS 가로 확장 | 127 | ||
| MDH | MCSCS 가로 확장 | 24 | ||
| T1 | CNS 11643-1992 비행기 1 | 5,413 | 18,384 | |
| T2 | CNS 11643-1992 비행기 2 | 7,651 | ||
| T3 | CNS 11643-1992 비행기 3 | 4,144 | ||
| T4 | CNS 11643-1992 비행기 4 | 894 | ||
| T5 | CNS 11643-1992 비행기 5 | 64 | ||
| T6 | CNS 11643-1992 비행기 6 | 31 | ||
| T7 | CNS 11643-1992 비행기 7 | 16 | ||
| TB | CNS 11643-2007 비행기 11 | 2 | ||
| TC | CNS 11643-2007 비행기 12 | 2 | ||
| TE | CNS 11643-2007 비행기 14 | 9 | ||
| TF | CNS 11643-2007 비행기 15 | 158 | ||
| V0 | TCVN 5773:1993 | 599 | 4,808 | |
| V1 | TCVN 6056:1995 | 3,305 | ||
| V2 | VHN 01-1998 | 759 | ||
| V3 | NHN 02-1998 | 91 | ||
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 19 | ||
| VN | 베트남어의 가로 연장 | 35 | ||
| n/a | UTC | UTC출처 | 77 | 77 |
유니코드 4.1에서는 14개의 HKSCS-2004 문자와 8GB의 18030 문자가 U+9 사이에 할당되었습니다.FA6 및 U+9FBB 코드 포인트.그 이후로 여러 가지 이유로 이 블록에 다른 추가 사항이 추가되었으며, 모두 아래 버전 기록 섹션에 요약되어 있습니다.
CJK 통합아이디어스 확장자 A
CJK Unified Ideographes Extension A(3400–4DBF)라는 이름의 블록에는 U+3400~U+4DBF 범위에 6,592자가 추가로 포함되어 있습니다.
차트
원천
참고: 대부분의 문자는 두 개 이상의 소스에 표시되므로 개별 문자 수의 합(18,835)이 인코딩된 문자 수(6,[10]592)보다 훨씬 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| G3 | GB 7589-87 전통 양식 | 2,391 | 6,197 | |
| G5 | GB 7590-87 전통적인 | 1,226 | ||
| G7 | 현대 한자표 | 120 | ||
| GGFZ | 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () | 2 | ||
| GHZ | 하뉴 다지디안 (漢語大字典)漢語大字典 han) | 340 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 3 | ||
| GKX | 강희사전(康熙典) | 1,889 | ||
| 지에스 | 싱가포르 한자[note 1] | 226 | ||
| H | 홍콩 보조 캐릭터 세트, 2008 | 572 | 572 | |
| J3 | JIS X 0213:2004 레벨 3 | 2 | 738 | |
| J4 | JIS X 0213:2004 레벨 4 | 78 | ||
| 네. | 일본 IT 벤더의 현대적 이념, 1993 | 574 | ||
| JA3 | JIS X 0213: 2004 레벨 3 문자가 JA 문자를 대체합니다. | 17 | ||
| JA4 | JIS X 0213: 2004 레벨 4 문자가 JA 문자를 대체함 | 67 | ||
| K3 | PKS C 5700-2:1994 | 1,833 | 1,866 | |
| K4 | PKS 5700-3:1998 | 2 | ||
| K6 | KS X 1027-5:2014 | 28 | ||
| KC | 한국사 온라인(韓國史 On-line) | 3 | ||
| KP0 | KPS 9566-97 | 1 | 3,191 | |
| KP1 | KPS 10721-2000 | 3,190 | ||
| 엄마. | HKSCS-2008 | 4 | 12 | |
| MD | MCSCS 가로 확장 | 8 | ||
| T3 | CNS 11643-1992 비행기 3 | 2,179 | 5,916 | |
| T4 | CNS 11643-1992 비행기 4 | 2,919 | ||
| T5 | CNS 11643-1992 비행기 5 | 399 | ||
| T6 | CNS 11643-1992 비행기 6 | 200 | ||
| T7 | CNS 11643-1992 비행기 7 | 133 | ||
| TE | CNS 11643-2007 비행기 14 | 1 | ||
| TF | CNS 11643-2007 비행기 15 | 85 | ||
| 영국 | IRG N2107R2 | 3 | 3 | |
| V0 | TCVN 5773:1993 | 140 | 319 | |
| V2 | VHN 01-1998 | 149 | ||
| V3 | NHN 02-1998 | 19 | ||
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 5 | ||
| VN | 베트남어의 가로 연장 | 6 | ||
| n/a | UTC | UTC출처 | 21 | 21 |
CJK 통합아이디어스 확장자 B
CJK 통합아이디어스 확장 B 블록 (200000-2A6)DF)에는 U+200000 ~ U+2A6DF 범위의 42,720자가 포함됩니다.여기에는 기본 CJK 통합 한자 블록에 없는 강시사전에 사용된 대부분의 문자와 이전에 베트남어를 쓸 때 사용된 많은 한놈 문자가 포함됩니다.
차트
20000-215FF, 21600-230FF, 23100-245FF, 24600-260FF, 26100-275FF, 27600-290FF, 29100-2A6DF.
원천
참고: 많은 문자가 두 개 이상의 소스에 표시되므로 개별 문자 수의 합(74,208)이 인코딩된 문자 수(42,720)[10]보다 훨씬 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| G3 | GB 7589-87 전통 양식 | 1 | 30,550 | |
| G4K | 시쿠 취안슈 (四庫全書) () | 477 | ||
| GBK | 중국백과사전 (1901) | 86 | ||
| GCH | 치하이 (辞海海) | 247 | ||
| GCY | 치위안 (辭源園) | 66 | ||
| GFZ | 창립자 프레스 시스템 | 65 | ||
| GGFZ | 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () | 5 | ||
| GHC | 하뉴 다치디언 (漢語大詞典)漢語大詞典) | 553 | ||
| GHF | Hanwen Fodian yannan suzihuishi yanju (漢文佛典疑難俗字彙釋與研究)) | 1 | ||
| GHZ | 하뉴 다지디안 (漢語大字典)漢語大字典 han) | 10,508 | ||
| GHZR | 하뉴 다지디안 2판.(汉语大字典, 第二版) | 1 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 17 | ||
| GKX | 강희사전(康熙典) | 18,471 | ||
| 지유 | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 52 | ||
| H | 홍콩 보조 캐릭터 세트, 2008 | 1,703 | 1,703 | |
| J3 | JIS X 0213:2004 레벨 3 | 25 | 303 | |
| J3A | JIS X 0213:2004 레벨 3 부록 | 1 | ||
| J4 | JIS X 0213:2004 레벨 4 | 277 | ||
| K1 | KS C 5657-91 (현 KS X 1002:2001) | 1 | 261 | |
| K4 | PKS 5700-3:1998 | 166 | ||
| K6 | KS X 1027-5:2014 | 80 | ||
| KC | 한국사 온라인(韓國史 On-line) | 14 | ||
| KP1 | KPS 10721-2000 | 5,765 | 5,765 | |
| 엄마. | HKSCS-2008 | 9 | 38 | |
| MC를 | MCSCS 참조 | 2 | ||
| MD | MCSCS 가로 확장 | 27 | ||
| T3 | CNS 11643-1992 비행기 3 | 25 | 30,193 | |
| T4 | CNS 11643-1992 비행기 4 | 3,408 | ||
| T5 | CNS 11643-1992 비행기 5 | 8,111 | ||
| T6 | CNS 11643-1992 비행기 6 | 5,934 | ||
| T7 | CNS 11643-1992 비행기 7 | 6,299 | ||
| TA | CNS 11643-2007 비행기 10 | 8 | ||
| TB | CNS 11643-2007 비행기 11 | 6 | ||
| TC | CNS 11643-2007 비행기 12 | 1 | ||
| TF | CNS 11643-2007 비행기 15 | 6,401 | ||
| 영국 | IRG N2107R2 | 12 | 12 | |
| V0 | TCVN 5773:1993 | 1,570 | 5,299 | |
| V1 | TCVN 6056:1995 | 1 | ||
| V2 | VHN 01-1998 | 2,286 | ||
| V3 | NHN 02-1998 | 422 | ||
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 33 | ||
| VN | 베트남어의 가로 연장 | 987 | ||
| n/a | 앉았다 | SAT 다이조쿄 문자 데이터베이스 | 1 | 84 |
| UTC | UTC출처 | 83 |
CJK 통합아이디어스 확장자 C
CJK Unified Ideographes Extension C(2A700–2B73F)라는 이름의 블록에는 U+2A700~U+2B739 범위의 4,154자가 포함되어 있습니다.유니코드 5.2(2009)에서 처음 추가되었습니다.
차트
원천
참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(4,570)이 인코딩된 문자 수(4,154)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| GBK | 중국백과사전 (1901) | 74 | 1,130 | |
| GCH | 치하이 (辞海海) | 264 | ||
| GCY | 치위안 (辭源園) | 1 | ||
| GCYYY | 중국측량지도연구원 | 55 | ||
| 지디엠 | 중화인민공화국 공안부 공안국의 지명 문자 | 1 | ||
| GFZ | 창립자 프레스 시스템 | 1 | ||
| GGFZ | 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () | 2 | ||
| GGH | 구다이 하뉴 치디안 (古代汉语词典) g古代汉语词典) | 51 | ||
| GHC | 하뉴 다치디언 (漢語大詞典)漢語大詞典) | 14 | ||
| GHZ | 하뉴 다지디안 (漢語大字典)漢語大字典 han) | 1 | ||
| GHZR | 하뉴 다지디안 2판.(汉语大字典, 第二版) | 1 | ||
| GJZ | 커머셜 프레스 광고주 | 61 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 6 | ||
| GKX | 강희사전(康熙典) | 6 | ||
| GXC | 시안다이 하뉴 치디안 (现代汉语词典) xi现代汉语词典) | 25 | ||
| GZFY | 하뉴 팡옌 다치디언 (汉语方言大词典) | 202 | ||
| GZJW | 음저우 진원 지청 인데 (殷周金文集成引得) yin j) | 365 | ||
| H | 홍콩 보조 캐릭터 세트, 2008 | 1 | 1 | |
| JK | 일본 고쿠지 컬렉션 | 367 | 367 | |
| K5 | 한국 IRG 한자 캐릭터 세트 | 404 | 406 | |
| K6 | KS X 1027-5:2014 | 1 | ||
| KC | 한국사 온라인(韓國史 On-line) | 1 | ||
| KP1 | KPS 10721-2000 | 8 | 8 | |
| MC를 | MCSCS 참조 | 17 | 21 | |
| MD | MCSCS 가로 확장 | 4 | ||
| T5 | CNS 11643-1992 비행기 5 | 1 | 1,752 | |
| TC | CNS 11643-2007 비행기 12 | 634 | ||
| TD | CNS 11643-2007 비행기 13 | 766 | ||
| TE | CNS 11643-2007 비행기 14 | 350 | ||
| TU | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 1 | ||
| 영국 | IRG N2107R2 | 1 | 1 | |
| V0 | TCVN 5773:1993 | 4 | 795 | |
| V1 | TCVN 6056:1995 | 2 | ||
| V2 | VHN 01-1998 | 1 | ||
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 782 | ||
| VN | 베트남어의 가로 연장 | 6 | ||
| n/a | UTC | UTC출처 | 89 | 89 |
CJK 통합아이디어스 확장자
CJK Unified Ideographes Extension D(2B740–2B81F)라는 이름의 블록에는 유니코드 6.0(2010)에서 추가된 U+2B740~U+2B81D 범위의 222자가 포함되어 있습니다.
차트
원천
참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(229)이 인코딩된 문자 수(222)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| GCH | 치하이 (辞海海) | 1 | 78 | |
| GIDC | 중국 공안부 신분증 제도 | 32 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 2 | ||
| GXC | 시안다이 하뉴 치디안 (现代汉语词典) xi现代汉语词典) | 4 | ||
| GZH | 중화지하이 | 39 | ||
| JH | Hanyo-Denshi Program (汎用電子情報交換環境整備プログラム) | 107 | 107 | |
| TB | CNS 11643-2007 비행기 11 | 24 | 24 | |
| n/a | UTC | UTC출처 | 20 | 20 |
CJK 통합아이디어스 확장자 E
CJK Unified Ideographs Extension E(2B820–2CEAF)라는 이름의 블록에는 유니코드 8.0(2015)에서 추가된 U+2B820~U+2CEA1 범위의 5,762자가 포함되어 있습니다.
차트
원천
참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(5,830)이 인코딩된 문자 수(5,762)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| GBK | 중국백과사전 (1901) | 15 | 2,821 | |
| GCH | 치하이 (辞海海) | 112 | ||
| GCY | 치위안 (辭源園) | 3 | ||
| GCYYY | 중국측량지도연구원 | 98 | ||
| GDZ | 지질학적 출판사 표제어 | 1 | ||
| GGFZ | 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () | 4 | ||
| GGH | 구다이 하뉴 치디안 (古代汉语词典) g古代汉语词典) | 175 | ||
| GHC | 하뉴 다치디언 (漢語大詞典)漢語大詞典) | 7 | ||
| GIDC | 중국 공안부 신분증 제도 | 36 | ||
| GJZ | 커머셜 프레스 광고주 | 147 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 2 | ||
| GKX | 강희사전(康熙典) | 22 | ||
| GRM | 인민일보사 | 3 | ||
| 지유 | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 1 | ||
| GWZ | 하뉴 다치디언 출판사각주 | 12 | ||
| GXC | 시안다이 하뉴 치디안 (现代汉语词典) xi现代汉语词典) | 57 | ||
| GXH | 신화지뎬 (新華之新华字典) | 4 | ||
| GZFY | 하뉴 팡옌 다치디언 (汉语方言大词典) | 712 | ||
| GZJW | 음저우 진원 지청 인데 (殷周金文集成引得) yin j) | 1,410 | ||
| HD | 홍콩 보조 캐릭터 세트, 2016 | 1 | 1 | |
| JK | 일본 고쿠지 컬렉션 | 415 | 415 | |
| KC | 한국사 온라인(韓國史 On-line) | 7 | 7 | |
| MC를 | MCSCS 참조 | 48 | 51 | |
| MD | MCSCS 가로 확장 | 3 | ||
| T3 | CNS 11643-1992 비행기 3 | 2 | 1,261 | |
| TB | CNS 11643-2007 비행기 11 | 2 | ||
| TC | CNS 11643-2007 비행기 12 | 323 | ||
| TD | CNS 11643-2007 비행기 13 | 595 | ||
| TE | CNS 11643-2007 비행기 14 | 339 | ||
| 영국 | IRG N2107R2 | 2 | 2 | |
| V0 | TCVN 5773:1993 | 6 | 1,036 | |
| V2 | VHN 01-1998 | 1 | ||
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 1,023 | ||
| VN | 베트남어의 가로 연장 | 6 | ||
| n/a | UTC | UTC출처 | 236 | 236 |
CJK 통합아이디어스 확장자 F
이 블록의 이름은 CJK Unified Idegraphics Extension F (2CEB0-2EB)입니다.EF)는 유니코드 10.0(2017)에서 추가된 U+2CEB0 ~ 2EBE0 범위의 7,473자를 포함합니다.좡족을 위한 1,000개 이상의 순디프 문자가 포함되어 있습니다.
차트
원천
참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(7,774)이 인코딩된 문자 수(7,473)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| GCY | 치위안 (辭源園) | 122 | 1,309 | |
| GFC | 현대 중국 표준 사전 (现代汉语规范词典第二版) | 27 | ||
| GIDC | 중국 공안부 신분증 제도 | 1 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 5 | ||
| GLGYJ | 좡랴오송 연구(壮族嘹歌研究ao松 () | 1 | ||
| GOCD | 옥스포드 영어-중국어-영어 사전 (牛津英汉汉英词典) | 2 | ||
| GPGLG | Zhuang Folk Song Culture Series - Pingguo County Liao Songs (壮族民歌文化丛书•平果嘹歌) | 70 | ||
| GXHZ | 신화 다즈뎬 | 51 | ||
| GZ | 좡어사전 | 995 | ||
| GZJW | 음저우 진원 지청 인데 (殷周金文集成引得) yin j) | 33 | ||
| GZYS | 중국고대민족문자연구(漢古代族文字中国民族古文字研究 () | 2 | ||
| HD | 홍콩 보조 캐릭터 세트, 2016 | 1 | 1 | |
| JMJ | 전자정부 "모지조호-기반 프로젝트" 캐릭터 정보 개발 및 정비 사업 (文字情報基盤整備事業) | 1,645 | 1,645 | |
| KC | 한국사 온라인(韓國史 On-line) | 1,810 | 1,810 | |
| MC를 | MCSCS 참조 | 22 | 22 | |
| T3 | CNS 11643-1992 비행기 3 | 1 | 3 | |
| T6 | CNS 11643-1992 비행기 6 | 1 | ||
| TC | CNS 11643-2007 비행기 12 | 1 | ||
| 영국 | IRG N2107R2 | 2 | 2 | |
| V0 | TCVN 5773:1993 | 1 | 17 | |
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 8 | ||
| VN | 베트남어의 가로 연장 | 8 | ||
| n/a | 앉았다 | SAT 다이조쿄 문자 데이터베이스 | 2,884 | 2,965 |
| UTC | UTC출처 | 81 |
CJK 통합아이디어스 확장자 G
4,[13]939자를 포함하는 U+30000~U+3134F 범위의 3차 이념 평면에 유니코드 13.0의 일부로 CJK Unified Ideographics Extension G라는 블록이 추가되었습니다.
차트
원천
참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(5,081)이 인코딩된 문자 수(4,939)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| GHZR | 하뉴 다지디안 2판.(汉语大字典, 第二版) | 878 | 2,082 | |
| GPGLG | Zhuang Folk Song Culture Series - Pingguo County Liao Songs (壮族民歌文化丛书•平果嘹歌) | 13 | ||
| GZ | 좡어사전 | 1,191 | ||
| KC | 한국사 온라인(韓國史 On-line) | 435 | 435 | |
| T13 | CNS 11643 (새로운 버전 보류 중) 평면 19 | 347 | 353 | |
| TB | CNS 11643-2007 비행기 11 | 3 | ||
| TC | CNS 11643-2007 비행기 12 | 2 | ||
| TD | CNS 11643-2007 비행기 13 | 1 | ||
| 영국 | IRG N2107R2 | 1,566 | 1,566 | |
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 6 | 76 | |
| VN | 베트남어의 가로 연장 | 70 | ||
| n/a | 앉았다 | SAT 다이조쿄 문자 데이터베이스 | 329 | 569 |
| UTC | UTC출처 | 240 |
CJK 통합아이디어스 확장 H
Unified Ideographics Extension H라는 블록은 Unicode 15.0의 일부로 U+3135에서 U+323 범위의 3차측 Ideographic Plane에 추가되었습니다.AF, 4,[14]192자 포함.
차트
원천
참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(4,306)이 인코딩된 문자 수(4,192)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| 지디엠 | 중화인민공화국 공안부 공안국의 지명 문자 | 128 | 829 | |
| GHC | 하뉴 다치디언 (漢語大詞典)漢語大詞典) | 27 | ||
| GKJ | 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) | 30 | ||
| GLGYJ | 좡랴오송 연구(壮族嘹歌研究ao松 () | 11 | ||
| GPGLG | Zhuang Folk Song Culture Series - Pingguo County Liao Songs (壮族民歌文化丛书•平果嘹歌) | 14 | ||
| 지유 | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 1 | ||
| GXM | 중화인민공화국 공안부 공안부 공안국의 중국 내 개인 명의 사용 문자 | 216 | ||
| GZ | 좡어사전 | 285 | ||
| GZA-1 | 활기차고 끊기지 않는 전승, 효도와 장송(張孝与壮族行孝歌之研究) | 6 | ||
| GZA-2 | 주석 장강도덕가(長江道道樂歌) | 38 | ||
| GZA-3 | Compendium of Old Zhuang Folksong Texts—Wooing Songs vol. 1—Liao Songs (壮族民歌古籍集成•情歌(一)嘹歌) | 2 | ||
| GZA-4 | 옛 장민요전집—애국가 제1권—풍응간(風情歌(二)欢𭪤·壮族民歌古籍集成壮族民歌古籍集成情歌(二)欢𭪤(•x·) () | 11 | ||
| GZA-6 | 중국에서 온 좡어 (中国壮族谚语 | 59 | ||
| GZA-7 | 고대추억—장창신화곡 (远古的追忆壮族创世神话古歌研究新華曲) | 1 | ||
| KC | 한국사 온라인(韓國史 On-line) | 512 | 512 | |
| KP1 | KPS 10721-2000 | 1 | 1 | |
| T12 | CNS 11643 (새로운 버전 보류 중) 평면 18 | 7 | 714 | |
| T13 | CNS 11643 (새로운 버전 보류 중) 평면 19 | 696 | ||
| T4 | CNS 11643-1992 비행기 4 | 1 | ||
| T6 | CNS 11643-1992 비행기 6 | 1 | ||
| TB | CNS 11643-2007 비행기 11 | 5 | ||
| TC | CNS 11643-2007 비행기 12 | 3 | ||
| TE | CNS 11643-2007 비행기 14 | 1 | ||
| 영국 | IRG N2232R | 917 | 917 | |
| V0 | TCVN 5773:1993 | 6 | 931 | |
| V4 | Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) | 74 | ||
| VN | 베트남어의 가로 연장 | 851 | ||
| n/a | 앉았다 | SAT 다이조쿄 문자 데이터베이스 | 241 | 402 |
| UTC | UTC출처 | 161 |
CJK 통합아이디어스 확장자 I
622자를 포함하는 [15]U+2EBF0 ~ U+2EE5F 범위의 보조 이념 평면에 유니코드 15.1의 일부로 CJK Unified Idegraphics Extension I이라는 블록이 추가되었습니다.
차트
원천
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| GIDC23 | 중국 공안부 신분증 시스템, 2023 | 622 | 622 |
[기사내용] CJK호환성표기
CJK 호환 아이디그래프(F900-FA)라는 이름의 블록FF)는 다른 표준과 왕복 호환성을 유지하기 위해 만들어졌습니다.12개의 등장인물만이 "통합이상형" 속성을 가지고 있습니다.U+FA0E, FA0F, FA11, FA13, FA14, FA1F, FA21, FA23, FA24, FA27, FA28, FA29.[1]이 블록과 다른 "호환성" 블록에 포함된 다른 문자는 CJK 통일과 관련이 없습니다.
차트
원천
참고: 모든 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(36)이 인코딩된 문자 수(12)[10]보다 큽니다.
| 국가 또는 지역 | 코드 | 출처[11] | 문자수 | 총 |
|---|---|---|---|---|
| 지유 | 소스 없음(원래 소스 참조가 이동되었을 수 있음) | 12 | 12 | |
| J3 | JIS X 0213:2004 레벨 3 | 3 | 8 | |
| J4 | JIS X 0213:2004 레벨 4 | 3 | ||
| 네. | 일본 IT 벤더의 현대적 이념, 1993 | 1 | ||
| JA3 | JIS X 0213: 2004 레벨 3 문자가 JA 문자를 대체합니다. | 1 | ||
| TF | CNS 11643-2007 비행기 15 | 1 | 1 | |
| V0 | TCVN 5773:1993 | 3 | 3 | |
| n/a | UTC | UTC출처 | 12 | 12 |
알려진 문제
통일을
U+4039
U+4039 문자(䀹)는 유니코드 5.0까지 서로 다른 두 문자(하나는 지아 夾 음성, 하나는 ǎ 㚒 음성)를 통합한 것입니다.그러나, 그들은 통일되지 말았어야 하는 어휘적으로 다른 문자들이었습니다; 그들은 다른 발음과 다른 의미를 가지고 있습니다.
U+4039의 통일 해제 제안은 유니코드 5.1에서 받아들여졌으며, U+9FC3(鿃)에서 새로운 문자를 부호화하여 shǎn을 나타냈습니다.
확장 B에 있는 다른 3개의 글리프
CJK 통합 한자 확장자 B에서는 일부 문자가 다른 문자와 잘못 통일되어 있습니다.이러한 캐릭터는 U+2017B(파일럿), U+204를 포함합니다.AF(병렬) 및 U+24CB2(병렬).처음 두 글자는 중국 본토와 베트남의 글리프 원천을 잘못 통일한 반면, 마지막 한 글자는 중국 본토와 대만을 통일한 [17]것입니다.
식별할 수 없는 변형 및 정확한 복제
CJK Unified Ideographes Extension B에서도 수백 개의 글리프 변형이 [18]실수로 인코딩되었습니다.또한 ISO/IEC JTC 1/SC 2 보고서에 따르면 6개의 정확한 복제(동일한 문자가 실수로 두 번 인코딩된 경우)와 2개의 반 복제(CJK-B 문자가 해당 BMP 문자로 통일된 두 개의 글리프 형태의 사실상의 단일화를 나타내는 경우)가 [19]실수로 인코딩된 것으로 확인되었습니다.
- U+34A8 㒨 = U+20457 𠑗 : U+20457은 U+34A8에 대한 중국-소스 글리프와 동일하지만, U+34A8에 대한 대만-소스 글리프와는 현저한 차이가 있음
- U+3DB7 㶷 = U+2420E 𤈎 : 동일한 글리프 형태
- U+8641 虁 = U+27144 𧅄 : U+27144는 U+8641의 경우 한국어원 글리프와 동일하나 U+8641의 경우 중국 본토, 대만, 일본어원 글리프와 큰 차이가 있음
- U+204F2 𠓲 = U+23515 𣔕 : 동일한 글리프 모양이나, 다른 라디칼로 순서가 바름
- U+249BC 𤦼 = U+249E9 𤧩 : 동일한 글리프 모양
- U+24BD2 𤯒 = U+2A415 𪐕 : 동일한 글리프 형태이나, 다른 라디칼 하에서 정렬됨
- U+26842 𦡂 = U+26866 𦡦 : 동일한 글리프 형태
- U+FA23 﨣 = U+27EAF 𧺯 : 동일한 글리프 모양 (U+FA23 﨣는 "CJK Compatibility IDEOGRAPH-FA23"이라는 이름에도 불구하고 통합 CJK IDEOGRAPH입니다.
Unified가 아닌 유니코드로 된 기타 CJK 도형
Unified Ideographics의 10개 블록 외에도 Unified CJK 문자가 포함되지 않은 12개의 블록이 더 있습니다.이들은 주로 CJK 라디칼, 획, 구두점, 마크, 기호 및 호환 문자입니다.일부 문자는 다른 블록에 (분해가 가능한) 대응 문자를 가지고 있지만 사용 용도는 다를 수 있습니다.통합되지 않은 CJK 문자의 예로는 CJK 기호 및 문장부호 블록에서 U+3007 〇 IDEOGRAPHIC NUMBER ZERO가 있습니다.'CJK 통합이상형'에서는 다루지 않지만, 그 외의 모든 취지와 [20]목적에서 CJK 문자로 취급됩니다.
기존 텍스트 처리 시스템 및 이전 문자 집합과의 호환성을 위해 4개의 호환성 문자 블록이 포함되어 있습니다.
- CJK 호환성 (3300-33)FF)
- CJK 호환 양식 (FE30–FE4F)
- CJK 호환기호 (F900-FA)FF)
- CJK 호환 아이데그래프 부록 (2F800-2FA1F)
여기에는 세로 텍스트 레이아웃을 위한 문자 양식과 유니코드에서 다른 방법으로 처리할 것을 권장하는 풍부한 텍스트 문자가 포함됩니다.따라서 그들의 사용은 권장되지 않습니다.
글꼴 지원
블록 CJK Unified Ideographs 및 CJK Unified Ideographs Extension A는 기본 다국어 평면의 일부이며 대부분의 CJK 글꼴에서 지원됩니다.그러나 일본어와 한국어 글꼴은 보통 중국어보다 글자 수가 적습니다(각각 약 13,000자와 8,000자).확장자 B, C, D는 Vista [21]이후 Microsoft Windows에 포함된 추가 글꼴 MingLiU-ExtB, MingLiU_HKSCS-ExtB, PMingLiU-ExtB, SimSun-ExtB에서 지원됩니다.
유니코드 버전 기록
| 유니코드 버전 | 추가 | 비행기 | 추가된 문자 | 총문자수 |
|---|---|---|---|---|
| 1.0 (1991) | CJK 통합이상형 | 기본 다국어 평면(BMP) | 20,902 | 20,914 |
| [기사내용] CJK호환성표기 | BMP | 12 | ||
| 3.0 (1999) | CJK 통합아이디어스 확장자 A | BMP | 6,582 | 27,496 |
| 3.1 (2001) | CJK 통합아이디어스 확장자 B | SIP(Supplementary Ideographic Plane) | 42,711 | 70,207 |
| 4.1 (2005) | CJK 통합 한자:ISO 10646에 없는 HKSCS-2004 및 GB 18030-2000의 그림 | BMP | 22 | 70,229 |
| 5.1 (2008) | CJK 통합 한자:Adobe Japan의 Ideographes와 U+4039의 해체 | BMP | 8 | 70,237 |
| 5.2 (2009) | CJK 통합아이디어스 확장자 C | SIP | 4,149 | 74,394 |
| ARIB #47, #95, #93, HKSCS의 8명의 다른 캐릭터들 | BMP | 8 | ||
| 6.0 (2010) | CJK 통합아이디어스 확장자 | SIP | 222 | 74,616 |
| 6.1 (2012) | Adobe-Japan1-6 CID+20156에 해당하는 문자 1개 | BMP | 1 | 74,617 |
| 8.0 (2015) | CJK 통합아이디어스 확장자 E | SIP | 5,762 | 80,388 |
| 9개의 다른 캐릭터들 | BMP | 9 | ||
| 10.0 (2017) | CJK 통합아이디어스 확장자 F | SIP | 7,473 | 87,882 |
| 기타 21자 | BMP | 21 | ||
| 11.0 (2018) | CJK 통합이상형 | BMP | 5 | 87,887 |
| 13.0 (2020) | CJK 통합이상형 | BMP | 13 | 92,856 |
| CJK 통합아이디어스 확장자 A | BMP | 10 | ||
| CJK 통합아이디어스 확장자 B | SIP | 7 | ||
| CJK 통합아이디어스 확장자 G | 3차측 평면(TIP) | 4,939 | ||
| 14.0 (2021) | CJK 통합이상형 | BMP | 3 | 92,865 |
| CJK 통합아이디어스 확장자 B | SIP | 2 | ||
| CJK 통합아이디어스 확장자 C | SIP | 4 | ||
| 15.0 (2022) | CJK 통합아이디어스 확장자 C | SIP | 1 | 97,058 |
| CJK 통합아이디어스 확장 H | 팁. | 4,192 | ||
| 15.1 (2023) | CJK 통합아이디어스 확장자 I | SIP | 622 | 97,680 |
참고 항목
메모들
참고문헌
- ^ a b "Unicode 15.1 UCD: PropList.txt". 2023-08-01. Retrieved 2023-09-12.
- ^ "Unicode 15.0 UCD: Unihan: Unihan_IRGSources.txt". 2022-09-13. Retrieved 2022-09-22.
- ^ Lunde, Ken (2023-07-17). "UAX #45: U-source Ideographs". Unicode Consortium.
- ^ 유니코드 표준 4.0 부록 A - 한 통일사
- ^ 수잔 토핑, 웨이백 머신에서 유니코드의 비밀스러운 삶 (2007-11-14 아카이브)
- ^ "11장 - 동아시아 스크립트", 유니코드 표준, 4.0
- ^ "Ideographic Variation Database". 2022-09-13. Retrieved 2022-09-20.
- ^ "IVD Stats". 2022-09-13. Retrieved 2022-09-20.
- ^ PRI 108: Adobe Japan1 컬렉션과 해당 컬렉션의 시퀀스의 결합 등록
- ^ a b c d e f g h i j "Unihan_IRGSources.txt (from Unihan.zip)". 2023-07-15. Retrieved 2023-09-12.
- ^ a b c d e f g h i j k "UAX #38: Unicode Han Database (Unihan)". Unicode Consortium. 2023-09-01.
- ^ Lunde, Ken (2009). CJKV information processing (2nd ed.). Sebastopol, Calif.: O'Reilly Media, Inc. ISBN 978-0-596-15611-4. OCLC 317878469.
- ^ "Unicode 13.0.0". 10 March 2020. Retrieved 10 March 2020.
- ^ "Unicode 15.0.0". 13 September 2022. Retrieved 14 September 2022.
- ^ "Unicode 15.1.0". 2023-09-12. Retrieved 2023-09-12.
- ^ 앤드류 웨스트와 존 젠킨스, U+4039의 통일 제안
- ^ 찬 에이소(陈永聪),陈永聪 comments), CJK 통합이상형에 대한 4개의 오류 글리프에 대한 의견 Ext B & E.[1]
- ^ Taichi Kawabata. "IRGN1155 Possible Duplicates" (.zip). Retrieved 2019-06-22.
- ^ Cook, Richard (6 October 2003). "Defect Report on Duplicate Encoded CJK Forms" (PDF). ISO/IEC JTC1/SC2/WG2. Retrieved 2012-03-28.
- ^ GB/T 15835-2011《出版物上数字用法》.중국 궈자 비오즈훈.https://journals.usst.edu.cn/uploadfile/file/GBT%2015835-2011%E3%80%8A%E5%87%BA%E7%89%88%E7%89%A9%E4%B8%8A%E6%95%B0%E5%AD%97%E7%94%A8%E6%B3%95%E3%80%8B.pdf
- ^ Lunde, Ken (2009). CJKV Information Processing. O'Reilly. pp. 633–634. ISBN 978-0-596-51447-1.
외부 링크
- UK-Source Ideographics (문서 IRG N2107R2 및 IRG N2232R)