TRON(인코딩)

TRON (encoding)
트론
언어영어, 중국어, 일본어, 한국어
작성자TRON 프로젝트
분류DBCS
변환/인코딩JIS X 0208, JIS X 0212, JIS X 0213, GB 2312, KS X 1001, Big5, GB 18030, 기타

TRON 코드는 TRON 프로젝트에서 사용되는 멀티바이트 문자 인코딩입니다.Unicode와 비슷하지만 Unicode의 한 통일 프로세스를 사용하지 않습니다. 각 CJK 문자 집합의 각 문자는 현대 문자의 고대 문자 및 역사적 문자 등 별도로 인코딩됩니다.즉, 중국어, 일본어, 한국어 텍스트는 문자의 정확한 형태에 대해 모호함 없이 혼재할 수 있지만, 동일한 의미론을 가진 많은 문자가 두 번 이상 인코딩되어 일부 작업이 복잡해진다는 것을[which?] 의미합니다.

TRON에는 1억 5천만 개의 코드 포인트를 저장할 수 있는 공간이 있습니다.Unicode 4.1의 70,000자 이상의 한자를 중국어, 한국어 및 일본어 버전으로 구분하는 코드 포인트(필요하다고 판단되는 경우)는 TRON에 200,000자 이상의 코드 포인트가 필요합니다.TRON은 Unicode 2.0의 한자가 아닌 문자를 포함하지만 Unicode가 확장됨에 따라 최신 버전의 Unicode를 최신 버전으로 유지하지 못했습니다.기본 다국어 플레인 및 기존 스크립트에 문자를 추가합니다.TRON 인코딩은 [1]JIS X 0213 등의 최신 코드페이지 업데이트를 포함하도록 갱신되었습니다.

TRON 인코딩 글꼴을 사용할 수 있지만 상업적인 [2]사용에 제한이 있습니다.

구조.

TRON 코드의 각 문자는 2바이트입니다.ISO/IEC 2022와 마찬가지로 TRON 문자 부호화는 언어 지정 코드라고 불리는 이스케이프 시퀀스를 사용하여 48,400개의 코드 포인트의 플레인 간에 전환함으로써 단일 문자 부호화 내의 여러 문자 집합의 문자를 처리합니다.TRON 코드에 짜넣어진 문자 세트에는, JIS X 0208GB 2312같은 기존의 문자 세트, 다이칸와 지텐등의 다른 문자 소스, 및 동바 기호등의 다른 인코딩에 포함되지 않는 스크립트가 포함됩니다.

문자 집합 전체가 TRON 코드에 포함되어 있기 때문에, 상당수의 문자는 복수의 의미에 의해 부호화됩니다.예를 들어, GT 서체의 모든 한자는 JIS X 0208 등 이미 포함되어 있는 다른 한자 집합과 겹치는 경우가 많습니다.예를 들어, 문자 「」(U+4E9C 의 Unicode 에 있는 경우)는, JIS X 0208 영역의 1-3021, GT 서체 영역의 2-2464, 및 Dai Kan-Wa Jiten 영역의 8-2373 에 표시됩니다.

제어 코드

0x00 ~ 0x20 및 0x7F 범위의 바이트는 제어 코드에서 사용하기 위해 예약되어 있습니다.

문자 코드

각 평면의 문자는 4개의 존으로 나뉩니다.각 존은 개별적으로 할당됩니다.예를 들어 플레인1 JIS X 0208 문자는 존A에 0x2121부터, JIS X 0213 문자는 존A와 존B 양쪽에, GB 2312 문자는 존C에 0x2180부터 각각 배치됩니다.

구역 첫 번째 바이트 두 번째 바이트
존 A 0x21 - 0x7E 0x21 - 0x7E
존 B 0x80 - 0xFD 0x21 - 0x7E
존 C 0x21 - 0x7E 0x80 - 0xFD
존 D 0x80 - 0xFD 0x80 - 0xFD

코드 포인트는 X-YYYY로 표기됩니다.X는 10 진수의 플레인 번호, YYY는 16 진수의 코드 포인트입니다.또는 0xNNYYY 표기법을 사용할 수 있다.여기서 NN은 언어특정부호의 제2바이트이다.텍스트 형식 "&TNNYYY;"는 HTML의 숫자 문자 참조와 유사한 방법으로 ASCII 텍스트의 TRON 코드 포인트를 나타내기 위해 사용할 수 있습니다.

언어 지정자 코드

언어 지정자 코드 앞에는 0xFE가 붙습니다.유효한 접미사는 0x21 ~0x7E 및 0x80 ~0xFE 입니다.이들 중 대부분은 할당되지 않았습니다.

특수 및 이스케이프 코드

특수 코드 앞에는 0xFF가 붙습니다.

평면

다음은 TRON 코드에서 사용하기 위해 할당된 평면과 대응하는 언어 지정자 코드 및 각 평면에 포함된 문자 세트에 대한 설명입니다.

비행기 언어 지정자 코드 묘사
1 FE 21 JIS X 0208, JIS X 0212, JIS X 0213, GB 2312, KS X 1001점자
2 FE 22 GT 서체 문자
3 FE 23 GT 서체 문자 계속
6 FE 26 빅5
8 FE 28 다이칸와 지텐의 등장인물
9 FE 29 다이칸와 지텐 계속, 헨타이가나, 기타 캐릭터
10 FE 2A 마이너리티 스크립트(동바 기호)
16 FE 30 Unicode 2.0 (CJK 통합 및 한글 제외)
17 FE 31 Unicode 2.0 (CJK 통합 및 한글 제외)계속
22 FE 36 GB 18030
23 FE 37 GB 18030은 계속

1115편은 원래 모지쿄 캐릭터 세트를 저장하기 위해 할당되었지만, 분쟁으로 인해 제외되었다.최대 31개의 다른 모든 플레인은 현재 향후 할당을 위해 예약되어 있습니다.

「 」를 참조해 주세요.

외부 링크

레퍼런스

  1. ^ "The name of T-Engine Forum was changed to TRON Forum". T-engine.org. 2015-04-01. Retrieved 2018-09-16.
  2. ^ "Tフォントプロジェクト 利用規定". Charcenter.t-engine.org. Retrieved 2018-09-16.