Z변수

Z-variant

유니코드에서는 두 글립자가 동일한 어원을 공유하지만 외관이 약간 다르고 유니코드 코드 포인트가 서로 다른 경우 Z-변수(흔히 zVariants라고 한다. 예를 들어 유니코드 문자 U+8AAA 說 및 U+8AAC 説은 Z-변수다. Z-분산 개념은 "CJKV 스크립트"에만 적용된다.—중국어, 일본어, 한국어 및 베트남어—한 통일의 하위 주제다.

Z축의 차이

CJK 언어의 코드 포인트 할당에 관한 유니코드 철학은 3개의 ""을 따라 구성된다. X축은 의미론적 차이를 나타낸다. 예를 들어 라틴 자본 A(U+0041 A)와 그리스 자본 알파(U+0391 α)는 유니코드에서 두 개의 구별되는 코드 포인트로 표현되며 "X-변수"(이 용어는 일반적이지 않지만)라고 불릴 수 있다. Y축은 의미론에서는 아니지만 외관상 큰 차이를 나타낸다. 예를 들어 전통적인 한자 mao "cat"(U+8C93 93)과 간체 한자(U+732B 猫)[1]는 Y변수다.

Z축은 사소한 인쇄상의 차이를 나타낸다. 예를 들어 한자(U+838A 莊)와 (U+8358 荘)는 그대로 (U+8) Z변량이다.AAA 說) 및 (U+8)AAC 説). Unicode.org의 용어집에서는 Z변량(Z-variant)을 한통일의 의미로 '불가능(unifable)'을 '동일한 의미와 형상을 가진 CJK 통일된 두 개의 한자'[1]로 정의하고 있다.

따라서 한통일이 완벽하게 성공한다면 Z변수는 존재하지 않을 것이다. 이들은 유니코드에 존재하는데, 이는 유니코드와 Big5CCCII와 같은 다른 CJK 인코딩 사이에 문서를 "원격 이동"할 수 있는 것이 유용하다고 여겨졌기 때문이다. 예를 들어, 문자 莊은 CCCII 인코딩 21552D를 가지고 있는 반면, 그것의 Z 변수 荘은 CCSCII 인코딩 2D552D를 가지고 있다. 따라서 이 두 변종에는 구별되는 유니코드 코드 포인트가 부여되어 CCCII 문서를 유니코드 및 백으로 변환하는 것은 무손실 작업이 될 것이다.

혼란

'Z변수'의 정확한 정의를 놓고 다소 혼선이 빚어지고 있다. 예를 들어, 인터넷 초안(의)에서 RFC3743) dated 2002,[2] one finds "no" (U+4E0D ) and (U+F967 ) described as "font variants," the term "Z-variant" being apparently reserved for interlanguage pairs such as the Mandarin Chinese "rabbit" (U+5154 ) and the Japanese to "rabbit" (U+514E ). 그러나 유니코드 컨소시엄유니한 데이터베이스는 두 쌍을 모두 Z-변수로 취급한다.

참고 항목

참조