CJK 통합이상형

CJK Unified Ideographs
중국어, 한국어, 베트남어, 일본어 간체형 CJKV 문자 次

중국어, 일본어, 한국어(CJK) 스크립트는 CJK 문자로 통칭되는 공통 배경을 공유합니다.한()통일이라는 과정에서 공통(공유)자를 확인하여 CJK 통일사상이라고 명명하였습니다.유니코드 15.1 기준으로 유니코드는 총 97,[1]680개의 문자를 정의하고 있습니다.

중국어 대본관념적이 아니라 기록적이기 때문에 관념적이라는 용어는 잘못된 이름입니다.

20세기 초까지 베트남에서도 한자(Ch Nom)를 사용했기 때문에 CJKV라는 약칭을 사용하기도 합니다.

원천

이데올로기 연구 그룹(Ideographic Research Group, IRG)은 CJK 통합 이데올로기의 인코딩된 레퍼토리에 대한 확장을 개발하는 역할을 맡고 있습니다.IRG는 회원국들이 제출한 새로운 CJK 통일사상에 대한 제안서를 처리하며, 수차례의 전문가 검토를 거친 후, 통합문자 집합을 ISO/IEC JTC 1/SC 2 Working Group 2 (WG2) 및 Unicode Technical Committee (UTC)에 제출하여 ISO/IEC 10646 Unicode 표준에 포함할 것을 고려하고 있습니다.다음 IRG 회원국들은 CJK 통일된 단체들의 표준화에 관련되어 있습니다.

UTC와 영국이 제출한 표식은 특정 지역에 특정한 것이 아니라 개별 전문가들이 부호화를 위해 제안한 문자입니다.SAT 다이조쿄 텍스트 데이터베이스에는 SAT가 제출한 표식이 필요합니다.

아래 표는 유니코드 15.[2]0의 각 IRG 소스에 대한 인코딩된 CJK 통합 아이디얼의 수를 보여줍니다.다수의 문자가 하나 이상의 소스를 가지고 있기 때문에 전체 문자 수(223,653개)는 인코딩된 CJK 통합 아이디얼 수(97,058개)를 훨씬 초과합니다.

출처별 CJK 통일사상
국가 또는 지역 문자수
중국 66,563
홍콩 17,654
마카오 344
타이완(TCA) 58,601
일본 16,148
대한민국. 20,739
북한 23,975
베트남 13,284
영국 2,503
앉았다 3,455
UTC 1,020
224,286

UTC출처

UTC가 IRG에 제출한 대부분의 문자는 유니코드 기술 위원회([3]UTC) 문서에서 파생된 것입니다.다른 출처는 다음과 같습니다.

CJK 통합 한자 블록

CJK 통합이상형

기본블록 이름은 CJK 통합아이디어그래프(4E00-9)FFF)에는 U+4E00 ~ U+9FF 범위의 기본 한자 20,992자가 포함되어 있습니다.이 블록에는 중국 문자 체계에서 사용되는 문자뿐만 아니라 일본 문자 체계에서 사용되는 한자, 한국의 한자, 베트남어의 쵸놈 문자도 포함되어 있습니다.이 블록의 많은 문자가 세 개의 쓰기 시스템 모두에 사용되는 반면 다른 문자는 세 개 중 하나 또는 두 개에만 사용됩니다.블록의 첫 번째 20,902자는 급진파강시 사전 순서에 따라 배열됩니다.이 시스템에서는 획 수가 가장 적은 문자가 먼저 나열됩니다.나머지 캐릭터는 나중에 추가된 것으로, 급진적인 순서가 아닙니다.

그 차단은 동아시아 [5]내에서 다소 논란이 되었던 한 통일[4]결과입니다.중국어, 일본어, 한국어 문자가 같은 위치에서 코딩되었기 때문에 선택된 글리프의 모양은 사용되는 특정 글꼴에 따라 달라질 수 있습니다.그러나 소스 구분 규칙에 따르면 이전 문자 집합에서 별도로 인코딩된 문자는 새 유니코드 [6]인코딩에서 별도로 유지됩니다.

변이 선택기를 사용하면 유니코드 [7]내에서 특정 변이 CJK 이데오그램을 지정할 수 있습니다.Adobe-Japan1 문자 집합은 14,684개의 변형 [8]순서를 가지고 있으며 변형 [9]선택기를 사용하는 극단적인 예입니다.

차트

4E00-62FF, 6300-77FF, 7800-8CFF, 8D00-9FF

원천

참고: 대부분의 문자는 여러 출처에 나타나므로 개별 문자 수의 합(102,795)이 인코딩된 문자 수(20,992)[10]보다 훨씬 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 G0 GB 2312-80 6,763 20,933
G1 GB 12345-90 2,202
G3 GB 7589-87 전통 양식 4,834
G5 GB 7590-87 전통적인 2,841
G7 현대 한자 일반문자도 (간체 중국어: 现代汉语通用字表) 42
G8 GB 8565-88 199
GCE 국립교육과학원 4
지디엠 중화인민공화국 공안부 공안국의 지명 문자 2
GE GB16500-95 3,772
GFC 현대 중국 표준 사전 (现代汉语规范词典第二版) 2
GGFZ 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () 1
GH GB/T 15564-1995 59
GHZ 하뉴 다지디안 (漢語大字典)漢語大字典 han) 1
GHZR 하뉴 다지디안 2판.(汉语大字典, 第二版) 1
GK GB 12052-89 89
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 16
GKX 강희사전(康熙典) 3
GLK 룽칸쇼우젠 (龍龍龕手鑑 () 1
지티 표준 전신 법규집 (개정), 1983 8
지유 소스 없음(원래 소스 참조가 이동되었을 수 있음) 92
GZFY 하뉴 팡옌 다치디언 (汉语方言大词典) 1
홍콩 H 홍콩 보조 캐릭터 세트, 2008 2,292 15,376
HB0 컴퓨터 중국어 글리프와 문자 코드 매핑 테이블, 기술 보고서 C-26
(電腦用中文字型與字碼對照表, 技術通報C-26)
9
HB1 빅5, 레벨 1 5,401
HB2 빅5, 레벨2 7,650
HD 홍콩 보조 캐릭터 세트, 2016 24
일본 J0 JIS X 0208-1990 6,356 12,565
J1 JIS X 0212-1990 3,058
J13 JIS X 0213: 2004 레벨 3 문자가 J1 문자를 대체한다. 1,037
J13A JIS X 0213:2004 level-3 문자 부록 JIS X 0213:2000 level-3이 J1 문자를 대체합니다. 2
J14 JIS X 0213: 2004 레벨 4 문자가 J1 문자를 대체한다. 1,704
J3 JIS X 0213:2004 레벨 3 95
J3A JIS X 0213:2004 레벨 3 부록 7
J4 JIS X 0213:2004 레벨 4 301
JARIB ARIB STD-B24 3
JMJ 전자정부 "모지조호-기반 프로젝트" 캐릭터 정보 개발 및 정비 사업 (文字情報基盤整備事業) 2
대한민국. K0 KS C 5601-87 (현 KS X 1001:2004) 4,620 15,442
K1 KS C 5657-91 (현 KS X 1002:2001) 2,855
K2 PKS C 5700-1:1994 7,911
K3 PKS C 5700-2:1994 1
K4 PKS 5700-3:1998 4
K6 KS X 1027-5:2014 49
KC 한국사 온라인(韓國史 On-line) 1
KU 소스 없음(원래 소스 참조가 이동되었을 수 있음) 1
북한 KP0 KPS 9566-97 4,652 15,010
KP1 KPS 10721-2000 10,358
마카오 엄마. HKSCS-2008 29 200
MB1 빅 파이브 10
MB2 빅 파이브 7
MC를 MCSCS 참조 3
MD MCSCS 가로 확장 127
MDH MCSCS 가로 확장 24
타이완 T1 CNS 11643-1992 비행기 1 5,413 18,384
T2 CNS 11643-1992 비행기 2 7,651
T3 CNS 11643-1992 비행기 3 4,144
T4 CNS 11643-1992 비행기 4 894
T5 CNS 11643-1992 비행기 5 64
T6 CNS 11643-1992 비행기 6 31
T7 CNS 11643-1992 비행기 7 16
TB CNS 11643-2007 비행기 11 2
TC CNS 11643-2007 비행기 12 2
TE CNS 11643-2007 비행기 14 9
TF CNS 11643-2007 비행기 15 158
베트남 V0 TCVN 5773:1993 599 4,808
V1 TCVN 6056:1995 3,305
V2 VHN 01-1998 759
V3 NHN 02-1998 91
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 19
VN 베트남어의 가로 연장 35
n/a UTC UTC출처 77 77

유니코드 4.1에서는 14개의 HKSCS-2004 문자와 8GB의 18030 문자가 U+9 사이에 할당되었습니다.FA6 및 U+9FBB 코드 포인트.그 이후로 여러 가지 이유로 이 블록에 다른 추가 사항이 추가되었으며, 모두 아래 버전 기록 섹션에 요약되어 있습니다.

CJK 통합아이디어스 확장자 A

CJK Unified Ideographes Extension A(3400–4DBF)라는 이름의 블록에는 U+3400~U+4DBF 범위에 6,592자가 추가로 포함되어 있습니다.

차트

3400-4DBF.

원천

참고: 대부분의 문자는 두 개 이상의 소스에 표시되므로 개별 문자 수의 합(18,835)이 인코딩된 문자 수(6,[10]592)보다 훨씬 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 G3 GB 7589-87 전통 양식 2,391 6,197
G5 GB 7590-87 전통적인 1,226
G7 현대 한자표 120
GGFZ 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () 2
GHZ 하뉴 다지디안 (漢語大字典)漢語大字典 han) 340
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 3
GKX 강희사전(康熙典) 1,889
지에스 싱가포르 한자[note 1] 226
홍콩 H 홍콩 보조 캐릭터 세트, 2008 572 572
일본 J3 JIS X 0213:2004 레벨 3 2 738
J4 JIS X 0213:2004 레벨 4 78
네. 일본 IT 벤더의 현대적 이념, 1993 574
JA3 JIS X 0213: 2004 레벨 3 문자가 JA 문자를 대체합니다. 17
JA4 JIS X 0213: 2004 레벨 4 문자가 JA 문자를 대체함 67
대한민국 K3 PKS C 5700-2:1994 1,833 1,866
K4 PKS 5700-3:1998 2
K6 KS X 1027-5:2014 28
KC 한국사 온라인(韓國史 On-line) 3
북조선 KP0 KPS 9566-97 1 3,191
KP1 KPS 10721-2000 3,190
마카오 엄마. HKSCS-2008 4 12
MD MCSCS 가로 확장 8
타이완 T3 CNS 11643-1992 비행기 3 2,179 5,916
T4 CNS 11643-1992 비행기 4 2,919
T5 CNS 11643-1992 비행기 5 399
T6 CNS 11643-1992 비행기 6 200
T7 CNS 11643-1992 비행기 7 133
TE CNS 11643-2007 비행기 14 1
TF CNS 11643-2007 비행기 15 85
영국 영국 IRG N2107R2 3 3
베트남 V0 TCVN 5773:1993 140 319
V2 VHN 01-1998 149
V3 NHN 02-1998 19
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 5
VN 베트남어의 가로 연장 6
n/a UTC UTC출처 21 21


CJK 통합아이디어스 확장자 B

CJK 통합아이디어스 확장 B 블록 (200000-2A6)DF)에는 U+200000 ~ U+2A6DF 범위의 42,720자가 포함됩니다.여기에는 기본 CJK 통합 한자 블록에 없는 강시사전에 사용된 대부분의 문자와 이전에 베트남어를 쓸 때 사용된 많은 한놈 문자가 포함됩니다.

차트

20000-215FF, 21600-230FF, 23100-245FF, 24600-260FF, 26100-275FF, 27600-290FF, 29100-2A6DF.

원천

참고: 많은 문자가 두 개 이상의 소스에 표시되므로 개별 문자 수의 합(74,208)이 인코딩된 문자 수(42,720)[10]보다 훨씬 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 G3 GB 7589-87 전통 양식 1 30,550
G4K 시쿠 취안슈 (四庫全書) () 477
GBK 중국백과사전 (1901) 86
GCH 치하이 (辞海海) 247
GCY 치위안 (辭源園) 66
GFZ 창립자 프레스 시스템 65
GGFZ 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () 5
GHC 하뉴 다치디언 (漢語大詞典)漢語大詞典) 553
GHF Hanwen Fodian yannan suzihuishi yanju (漢文佛典疑難俗字彙釋與研究)) 1
GHZ 하뉴 다지디안 (漢語大字典)漢語大字典 han) 10,508
GHZR 하뉴 다지디안 2판.(汉语大字典, 第二版) 1
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 17
GKX 강희사전(康熙典) 18,471
지유 소스 없음(원래 소스 참조가 이동되었을 수 있음) 52
홍콩 H 홍콩 보조 캐릭터 세트, 2008 1,703 1,703
일본 J3 JIS X 0213:2004 레벨 3 25 303
J3A JIS X 0213:2004 레벨 3 부록 1
J4 JIS X 0213:2004 레벨 4 277
대한민국 K1 KS C 5657-91 (현 KS X 1002:2001) 1 261
K4 PKS 5700-3:1998 166
K6 KS X 1027-5:2014 80
KC 한국사 온라인(韓國史 On-line) 14
북조선 KP1 KPS 10721-2000 5,765 5,765
마카오 엄마. HKSCS-2008 9 38
MC를 MCSCS 참조 2
MD MCSCS 가로 확장 27
타이완 T3 CNS 11643-1992 비행기 3 25 30,193
T4 CNS 11643-1992 비행기 4 3,408
T5 CNS 11643-1992 비행기 5 8,111
T6 CNS 11643-1992 비행기 6 5,934
T7 CNS 11643-1992 비행기 7 6,299
TA CNS 11643-2007 비행기 10 8
TB CNS 11643-2007 비행기 11 6
TC CNS 11643-2007 비행기 12 1
TF CNS 11643-2007 비행기 15 6,401
영국 영국 IRG N2107R2 12 12
베트남 V0 TCVN 5773:1993 1,570 5,299
V1 TCVN 6056:1995 1
V2 VHN 01-1998 2,286
V3 NHN 02-1998 422
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 33
VN 베트남어의 가로 연장 987
n/a 앉았다 SAT 다이조쿄 문자 데이터베이스 1 84
UTC UTC출처 83

CJK 통합아이디어스 확장자 C

CJK Unified Ideographes Extension C(2A700–2B73F)라는 이름의 블록에는 U+2A700~U+2B739 범위의 4,154자가 포함되어 있습니다.유니코드 5.2(2009)에서 처음 추가되었습니다.

차트

2A700-2B73F.

원천

참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(4,570)이 인코딩된 문자 수(4,154)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 GBK 중국백과사전 (1901) 74 1,130
GCH 치하이 (辞海海) 264
GCY 치위안 (辭源園) 1
GCYYY 중국측량지도연구원 55
지디엠 중화인민공화국 공안부 공안국의 지명 문자 1
GFZ 창립자 프레스 시스템 1
GGFZ 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () 2
GGH 구다이 하뉴 치디안 (古代汉语词典) g古代汉语词典) 51
GHC 하뉴 다치디언 (漢語大詞典)漢語大詞典) 14
GHZ 하뉴 다지디안 (漢語大字典)漢語大字典 han) 1
GHZR 하뉴 다지디안 2판.(汉语大字典, 第二版) 1
GJZ 커머셜 프레스 광고주 61
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 6
GKX 강희사전(康熙典) 6
GXC 시안다이 하뉴 치디안 (现代汉语词典) xi现代汉语词典) 25
GZFY 하뉴 팡옌 다치디언 (汉语方言大词典) 202
GZJW 음저우 진원 지청 인데 (殷周金文集成引得) yin j) 365
홍콩 H 홍콩 보조 캐릭터 세트, 2008 1 1
일본 JK 일본 고쿠지 컬렉션 367 367
대한민국 K5 한국 IRG 한자 캐릭터 세트 404 406
K6 KS X 1027-5:2014 1
KC 한국사 온라인(韓國史 On-line) 1
북조선 KP1 KPS 10721-2000 8 8
마카오 MC를 MCSCS 참조 17 21
MD MCSCS 가로 확장 4
타이완 T5 CNS 11643-1992 비행기 5 1 1,752
TC CNS 11643-2007 비행기 12 634
TD CNS 11643-2007 비행기 13 766
TE CNS 11643-2007 비행기 14 350
TU 소스 없음(원래 소스 참조가 이동되었을 수 있음) 1
영국 영국 IRG N2107R2 1 1
베트남 V0 TCVN 5773:1993 4 795
V1 TCVN 6056:1995 2
V2 VHN 01-1998 1
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 782
VN 베트남어의 가로 연장 6
n/a UTC UTC출처 89 89

CJK 통합아이디어스 확장자

CJK Unified Ideographes Extension D(2B740–2B81F)라는 이름의 블록에는 유니코드 6.0(2010)에서 추가된 U+2B740~U+2B81D 범위의 222자가 포함되어 있습니다.

차트

2B740–2B81F.

원천

참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(229)이 인코딩된 문자 수(222)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 GCH 치하이 (辞海海) 1 78
GIDC 중국 공안부 신분증 제도 32
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 2
GXC 시안다이 하뉴 치디안 (现代汉语词典) xi现代汉语词典) 4
GZH 중화지하이 39
일본 JH Hanyo-Denshi Program (汎用電子情報交換環境整備プログラム) 107 107
타이완 TB CNS 11643-2007 비행기 11 24 24
n/a UTC UTC출처 20 20

CJK 통합아이디어스 확장자 E

CJK Unified Ideographs Extension E(2B820–2CEAF)라는 이름의 블록에는 유니코드 8.0(2015)에서 추가된 U+2B820~U+2CEA1 범위의 5,762자가 포함되어 있습니다.

차트

2B820–2CEAF.

원천

참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(5,830)이 인코딩된 문자 수(5,762)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 GBK 중국백과사전 (1901) 15 2,821
GCH 치하이 (辞海海) 112
GCY 치위안 (辭源園) 3
GCYYY 중국측량지도연구원 98
GDZ 지질학적 출판사 표제어 1
GGFZ 통용귀판 한지지디안(通用通用规范汉字字典 hanziidian)通用规范汉字字典 tong () 4
GGH 구다이 하뉴 치디안 (古代汉语词典) g古代汉语词典) 175
GHC 하뉴 다치디언 (漢語大詞典)漢語大詞典) 7
GIDC 중국 공안부 신분증 제도 36
GJZ 커머셜 프레스 광고주 147
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 2
GKX 강희사전(康熙典) 22
GRM 인민일보사 3
지유 소스 없음(원래 소스 참조가 이동되었을 수 있음) 1
GWZ 하뉴 다치디언 출판사각주 12
GXC 시안다이 하뉴 치디안 (现代汉语词典) xi现代汉语词典) 57
GXH 신화지뎬 (新華之新华字典) 4
GZFY 하뉴 팡옌 다치디언 (汉语方言大词典) 712
GZJW 음저우 진원 지청 인데 (殷周金文集成引得) yin j) 1,410
홍콩 HD 홍콩 보조 캐릭터 세트, 2016 1 1
일본 JK 일본 고쿠지 컬렉션 415 415
대한민국 KC 한국사 온라인(韓國史 On-line) 7 7
마카오 MC를 MCSCS 참조 48 51
MD MCSCS 가로 확장 3
타이완 T3 CNS 11643-1992 비행기 3 2 1,261
TB CNS 11643-2007 비행기 11 2
TC CNS 11643-2007 비행기 12 323
TD CNS 11643-2007 비행기 13 595
TE CNS 11643-2007 비행기 14 339
영국 영국 IRG N2107R2 2 2
베트남 V0 TCVN 5773:1993 6 1,036
V2 VHN 01-1998 1
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 1,023
VN 베트남어의 가로 연장 6
n/a UTC UTC출처 236 236

CJK 통합아이디어스 확장자 F

블록의 이름은 CJK Unified Idegraphics Extension F (2CEB0-2EB)입니다.EF)는 유니코드 10.0(2017)에서 추가된 U+2CEB0 ~ 2EBE0 범위의 7,473자를 포함합니다.좡족을 위한 1,000개 이상의 순디프 문자가 포함되어 있습니다.

차트

2CEB0–2EBEF.

원천

참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(7,774)이 인코딩된 문자 수(7,473)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 GCY 치위안 (辭源園) 122 1,309
GFC 현대 중국 표준 사전 (现代汉语规范词典第二版) 27
GIDC 중국 공안부 신분증 제도 1
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 5
GLGYJ 좡랴오송 연구(壮族嘹歌研究ao () 1
GOCD 옥스포드 영어-중국어-영어 사전 (牛津英汉汉英词典) 2
GPGLG Zhuang Folk Song Culture Series - Pingguo County Liao Songs (壮族民歌文化丛书•平果嘹歌) 70
GXHZ 신화 다즈뎬 51
GZ 좡어사전 995
GZJW 음저우 진원 지청 인데 (殷周金文集成引得) yin j) 33
GZYS 중국고대민족문자연구(漢古代族文字中国民族古文字研究 () 2
홍콩 HD 홍콩 보조 캐릭터 세트, 2016 1 1
일본 JMJ 전자정부 "모지조호-기반 프로젝트" 캐릭터 정보 개발 및 정비 사업 (文字情報基盤整備事業) 1,645 1,645
대한민국 KC 한국사 온라인(韓國史 On-line) 1,810 1,810
마카오 MC를 MCSCS 참조 22 22
타이완 T3 CNS 11643-1992 비행기 3 1 3
T6 CNS 11643-1992 비행기 6 1
TC CNS 11643-2007 비행기 12 1
영국 영국 IRG N2107R2 2 2
베트남 V0 TCVN 5773:1993 1 17
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 8
VN 베트남어의 가로 연장 8
n/a 앉았다 SAT 다이조쿄 문자 데이터베이스 2,884 2,965
UTC UTC출처 81

CJK 통합아이디어스 확장자 G

4,[13]939자를 포함하는 U+30000~U+3134F 범위의 3차 이념 평면에 유니코드 13.0의 일부로 CJK Unified Ideographics Extension G라는 블록이 추가되었습니다.

차트

30000-3134F.

원천

참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(5,081)이 인코딩된 문자 수(4,939)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 GHZR 하뉴 다지디안 2판.(汉语大字典, 第二版) 878 2,082
GPGLG Zhuang Folk Song Culture Series - Pingguo County Liao Songs (壮族民歌文化丛书•平果嘹歌) 13
GZ 좡어사전 1,191
대한민국 KC 한국사 온라인(韓國史 On-line) 435 435
타이완 T13 CNS 11643 (새로운 버전 보류 중) 평면 19 347 353
TB CNS 11643-2007 비행기 11 3
TC CNS 11643-2007 비행기 12 2
TD CNS 11643-2007 비행기 13 1
영국 영국 IRG N2107R2 1,566 1,566
베트남 V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 6 76
VN 베트남어의 가로 연장 70
n/a 앉았다 SAT 다이조쿄 문자 데이터베이스 329 569
UTC UTC출처 240

CJK 통합아이디어스 확장 H

Unified Ideographics Extension H라는 블록은 Unicode 15.0의 일부로 U+3135에서 U+323 범위의 3차측 Ideographic Plane에 추가되었습니다.AF, 4,[14]192자 포함.

차트

31350–323AF.

원천

참고: 일부 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(4,306)이 인코딩된 문자 수(4,192)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 지디엠 중화인민공화국 공안부 공안국의 지명 문자 128 829
GHC 하뉴 다치디언 (漢語大詞典)漢語大詞典) 27
GKJ 중국 국가과학기술용어위원회(CNCTST)가 승인한 과학기술용어(1978) 30
GLGYJ 좡랴오송 연구(壮族嘹歌研究ao () 11
GPGLG Zhuang Folk Song Culture Series - Pingguo County Liao Songs (壮族民歌文化丛书•平果嘹歌) 14
지유 소스 없음(원래 소스 참조가 이동되었을 수 있음) 1
GXM 중화인민공화국 공안부 공안부 공안국의 중국 내 개인 명의 사용 문자 216
GZ 좡어사전 285
GZA-1 활기차고 끊기지 않는 전승, 효도와 장송(張孝与壮族行孝歌之研究) 6
GZA-2 주석 장강도덕가(長江道道樂歌) 38
GZA-3 Compendium of Old Zhuang Folksong Texts—Wooing Songs vol. 1—Liao Songs (壮族民歌古籍集成•情歌(一)嘹歌) 2
GZA-4 옛 장민요전집—애국가 제1권—풍응간(風情歌(二)欢𭪤·壮族民歌古籍集成壮族民歌古籍集成情歌(二)欢𭪤(•x·) () 11
GZA-6 중국에서 온 좡어 (中国壮族谚语 59
GZA-7 고대추억—장창신화곡 (远古的追忆壮族创世神话古歌研究新華曲) 1
대한민국 KC 한국사 온라인(韓國史 On-line) 512 512
북조선 KP1 KPS 10721-2000 1 1
타이완 T12 CNS 11643 (새로운 버전 보류 중) 평면 18 7 714
T13 CNS 11643 (새로운 버전 보류 중) 평면 19 696
T4 CNS 11643-1992 비행기 4 1
T6 CNS 11643-1992 비행기 6 1
TB CNS 11643-2007 비행기 11 5
TC CNS 11643-2007 비행기 12 3
TE CNS 11643-2007 비행기 14 1
영국 영국 IRG N2232R 917 917
베트남 V0 TCVN 5773:1993 6 931
V4 Kho Chữ Hán Nmm ho Hoá (한놈 코드화된 캐릭터 레퍼토리) 74
VN 베트남어의 가로 연장 851
n/a 앉았다 SAT 다이조쿄 문자 데이터베이스 241 402
UTC UTC출처 161

CJK 통합아이디어스 확장자 I

622자를 포함하는 [15]U+2EBF0 ~ U+2EE5F 범위의 보조 이념 평면에 유니코드 15.1의 일부로 CJK Unified Idegraphics Extension I이라는 블록이 추가되었습니다.

차트

2EBF0–2EE5F.

원천

국가 또는 지역 코드 출처[11] 문자수
중국 GIDC23 중국 공안부 신분증 시스템, 2023 622 622

[기사내용] CJK호환성표기

CJK 호환 아이디그래프(F900-FA)라는 이름의 블록FF)는 다른 표준과 왕복 호환성을 유지하기 위해 만들어졌습니다.12개의 등장인물만이 "통합이상형" 속성을 가지고 있습니다.U+FA0E, FA0F, FA11, FA13, FA14, FA1F, FA21, FA23, FA24, FA27, FA28, FA29.[1]이 블록과 다른 "호환성" 블록에 포함된 다른 문자는 CJK 통일과 관련이 없습니다.

차트

F900–FAFF.

원천

참고: 모든 문자는 둘 이상의 소스에 나타나므로 개별 문자 수의 합(36)이 인코딩된 문자 수(12)[10]보다 큽니다.

국가 또는 지역 코드 출처[11] 문자수
중국 지유 소스 없음(원래 소스 참조가 이동되었을 수 있음) 12 12
일본 J3 JIS X 0213:2004 레벨 3 3 8
J4 JIS X 0213:2004 레벨 4 3
네. 일본 IT 벤더의 현대적 이념, 1993 1
JA3 JIS X 0213: 2004 레벨 3 문자가 JA 문자를 대체합니다. 1
타이완 TF CNS 11643-2007 비행기 15 1 1
베트남 V0 TCVN 5773:1993 3 3
n/a UTC UTC출처 12 12

알려진 문제

통일을

U+4039

U+4039 문자(䀹)는 유니코드 5.0까지 서로 다른 두 문자(하나는 지아 夾 음성, 하나는 ǎ 㚒 음성)를 통합한 것입니다.그러나, 그들은 통일되지 말았어야 하는 어휘적으로 다른 문자들이었습니다; 그들은 다른 발음과 다른 의미를 가지고 있습니다.

U+4039의 통일 해제 제안은 유니코드 5.1에서 받아들여졌으며, U+9FC3(鿃)에서 새로운 문자를 부호화하여 shǎn을 나타냈습니다.

확장 B에 있는 다른 3개의 글리프

CJK 통합 한자 확장자 B에서는 일부 문자가 다른 문자와 잘못 통일되어 있습니다.이러한 캐릭터는 U+2017B(파일럿), U+204를 포함합니다.AF(병렬) 및 U+24CB2(병렬).처음 두 글자는 중국 본토와 베트남의 글리프 원천을 잘못 통일한 반면, 마지막 한 글자는 중국 본토와 대만을 통일한 [17]것입니다.

식별할 수 없는 변형 및 정확한 복제

CJK Unified Ideographes Extension B에서도 수백 개의 글리프 변형이 [18]실수로 인코딩되었습니다.또한 ISO/IEC JTC 1/SC 2 보고서에 따르면 6개의 정확한 복제(동일한 문자가 실수로 두 번 인코딩된 경우)와 2개의 반 복제(CJK-B 문자가 해당 BMP 문자로 통일된 두 개의 글리프 형태의 사실상의 단일화를 나타내는 경우)가 [19]실수로 인코딩된 것으로 확인되었습니다.

  • U+34A8 㒨 = U+20457 𠑗 : U+20457은 U+34A8에 대한 중국-소스 글리프와 동일하지만, U+34A8에 대한 대만-소스 글리프와는 현저한 차이가 있음
  • U+3DB7 㶷 = U+2420E 𤈎 : 동일한 글리프 형태
  • U+8641 虁 = U+27144 𧅄 : U+27144는 U+8641의 경우 한국어원 글리프와 동일하나 U+8641의 경우 중국 본토, 대만, 일본어원 글리프와 큰 차이가 있음
  • U+204F2 𠓲 = U+23515 𣔕 : 동일한 글리프 모양이나, 다른 라디칼로 순서가 바름
  • U+249BC 𤦼 = U+249E9 𤧩 : 동일한 글리프 모양
  • U+24BD2 𤯒 = U+2A415 𪐕 : 동일한 글리프 형태이나, 다른 라디칼 하에서 정렬됨
  • U+26842 𦡂 = U+26866 𦡦 : 동일한 글리프 형태
  • U+FA23 﨣 = U+27EAF 𧺯 : 동일한 글리프 모양 (U+FA23 﨣는 "CJK Compatibility IDEOGRAPH-FA23"이라는 이름에도 불구하고 통합 CJK IDEOGRAPH입니다.

Unified가 아닌 유니코드로 된 기타 CJK 도형

Unified Ideographics의 10개 블록 외에도 Unified CJK 문자가 포함되지 않은 12개의 블록이 더 있습니다.이들은 주로 CJK 라디칼, 획, 구두점, 마크, 기호 및 호환 문자입니다.일부 문자는 다른 블록에 (분해가 가능한) 대응 문자를 가지고 있지만 사용 용도는 다를 수 있습니다.통합되지 않은 CJK 문자의 로는 CJK 기호문장부호 블록에서 U+3007 IDEOGRAPHIC NUMBER ZERO가 있습니다.'CJK 통합이상형'에서는 다루지 않지만, 그 외의 모든 취지와 [20]목적에서 CJK 문자로 취급됩니다.

기존 텍스트 처리 시스템 및 이전 문자 집합과의 호환성을 위해 4개의 호환성 문자 블록이 포함되어 있습니다.

여기에는 세로 텍스트 레이아웃을 위한 문자 양식과 유니코드에서 다른 방법으로 처리할 것을 권장하는 풍부한 텍스트 문자가 포함됩니다.따라서 그들의 사용은 권장되지 않습니다.

글꼴 지원

블록 CJK Unified Ideographs 및 CJK Unified Ideographs Extension A는 기본 다국어 평면의 일부이며 대부분의 CJK 글꼴에서 지원됩니다.그러나 일본어와 한국어 글꼴은 보통 중국어보다 글자 수가 적습니다(각각 약 13,000자와 8,000자).확장자 B, C, D는 Vista [21]이후 Microsoft Windows에 포함된 추가 글꼴 MingLiU-ExtB, MingLiU_HKSCS-ExtB, PMingLiU-ExtB, SimSun-ExtB에서 지원됩니다.

유니코드 버전 기록

유니코드 버전별 CJK 통합 아이데그래프 추가
유니코드 버전 추가 비행기 추가된 문자 총문자수
1.0 (1991) CJK 통합이상형 기본 다국어 평면(BMP) 20,902 20,914
[기사내용] CJK호환성표기 BMP 12
3.0 (1999) CJK 통합아이디어스 확장자 A BMP 6,582 27,496
3.1 (2001) CJK 통합아이디어스 확장자 B SIP(Supplementary Ideographic Plane) 42,711 70,207
4.1 (2005) CJK 통합 한자:ISO 10646에 없는 HKSCS-2004GB 18030-2000의 그림 BMP 22 70,229
5.1 (2008) CJK 통합 한자:Adobe Japan의 Ideographes와 U+4039의 해체 BMP 8 70,237
5.2 (2009) CJK 통합아이디어스 확장자 C SIP 4,149 74,394
ARIB #47, #95, #93, HKSCS의 8명의 다른 캐릭터들 BMP 8
6.0 (2010) CJK 통합아이디어스 확장자 SIP 222 74,616
6.1 (2012) Adobe-Japan1-6 CID+20156에 해당하는 문자 1개 BMP 1 74,617
8.0 (2015) CJK 통합아이디어스 확장자 E SIP 5,762 80,388
9개의 다른 캐릭터들 BMP 9
10.0 (2017) CJK 통합아이디어스 확장자 F SIP 7,473 87,882
기타 21자 BMP 21
11.0 (2018) CJK 통합이상형 BMP 5 87,887
13.0 (2020) CJK 통합이상형 BMP 13 92,856
CJK 통합아이디어스 확장자 A BMP 10
CJK 통합아이디어스 확장자 B SIP 7
CJK 통합아이디어스 확장자 G 3차측 평면(TIP) 4,939
14.0 (2021) CJK 통합이상형 BMP 3 92,865
CJK 통합아이디어스 확장자 B SIP 2
CJK 통합아이디어스 확장자 C SIP 4
15.0 (2022) CJK 통합아이디어스 확장자 C SIP 1 97,058
CJK 통합아이디어스 확장 H 팁. 4,192
15.1 (2023) CJK 통합아이디어스 확장자 I SIP 622 97,680

참고 항목

메모들

  1. ^ 싱가포르 또는 해당 [12]한자무관한 임시 문자.

참고문헌

  1. ^ a b "Unicode 15.1 UCD: PropList.txt". 2023-08-01. Retrieved 2023-09-12.
  2. ^ "Unicode 15.0 UCD: Unihan: Unihan_IRGSources.txt". 2022-09-13. Retrieved 2022-09-22.
  3. ^ Lunde, Ken (2023-07-17). "UAX #45: U-source Ideographs". Unicode Consortium.
  4. ^ 유니코드 표준 4.0 부록 A - 한 통일사
  5. ^ 수잔 토핑, 웨이백 머신에서 유니코드의 비밀스러운 삶 (2007-11-14 아카이브)
  6. ^ "11장 - 동아시아 스크립트", 유니코드 표준, 4.0
  7. ^ "Ideographic Variation Database". 2022-09-13. Retrieved 2022-09-20.
  8. ^ "IVD Stats". 2022-09-13. Retrieved 2022-09-20.
  9. ^ PRI 108: Adobe Japan1 컬렉션과 해당 컬렉션의 시퀀스의 결합 등록
  10. ^ a b c d e f g h i j "Unihan_IRGSources.txt (from Unihan.zip)". 2023-07-15. Retrieved 2023-09-12.
  11. ^ a b c d e f g h i j k "UAX #38: Unicode Han Database (Unihan)". Unicode Consortium. 2023-09-01.
  12. ^ Lunde, Ken (2009). CJKV information processing (2nd ed.). Sebastopol, Calif.: O'Reilly Media, Inc. ISBN 978-0-596-15611-4. OCLC 317878469.
  13. ^ "Unicode 13.0.0". 10 March 2020. Retrieved 10 March 2020.
  14. ^ "Unicode 15.0.0". 13 September 2022. Retrieved 14 September 2022.
  15. ^ "Unicode 15.1.0". 2023-09-12. Retrieved 2023-09-12.
  16. ^ 앤드류 웨스트와 존 젠킨스, U+4039의 통일 제안
  17. ^ 찬 에이소(陈永聪),陈永聪 comments), CJK 통합이상형에 대한 4개의 오류 글리프에 대한 의견 Ext B & E.[1]
  18. ^ Taichi Kawabata. "IRGN1155 Possible Duplicates" (.zip). Retrieved 2019-06-22.
  19. ^ Cook, Richard (6 October 2003). "Defect Report on Duplicate Encoded CJK Forms" (PDF). ISO/IEC JTC1/SC2/WG2. Retrieved 2012-03-28.
  20. ^ GB/T 15835-2011《出版物上数字用法》.중국 궈자 비오즈훈.https://journals.usst.edu.cn/uploadfile/file/GBT%2015835-2011%E3%80%8A%E5%87%BA%E7%89%88%E7%89%A9%E4%B8%8A%E6%95%B0%E5%AD%97%E7%94%A8%E6%B3%95%E3%80%8B.pdf
  21. ^ Lunde, Ken (2009). CJKV Information Processing. O'Reilly. pp. 633–634. ISBN 978-0-596-51447-1.

외부 링크

  • UK-Source Ideographics (문서 IRG N2107R2 및 IRG N2232R)