ISO/IEC 10367
ISO/IEC 10367ISO/IEC 10367:1991은 ISO/IEC JTC 1/SC [1]2에 의해 개발된 표준으로, ISO/IEC 4873의[2] 레벨 2와 레벨 3을 구현하는 문자 인코딩에 사용할 그래픽 문자 세트를 정의한다(ISO/IEC 8859와 반대로 ISO/IEC 4873의 레벨 1에서 문자 인코딩을 정의).
ISO/IEC 8859와의 관계
ISO/IEC 8859의 부품은 ISO/IEC 4873의 레벨 1에서 완전한 부호화(즉, 상태 비저장 확장 ASCII 싱글바이트 부호화, C1 영역 예약)를 정의하며 여러 부품을 함께 사용할 수 없습니다.ISO/IEC 4873의 레벨 2와 레벨 3(즉, 추가 그래픽 문자 세트의 시프트 코드 포함)에서 사용하기 위해 ISO/IEC 8359는 [3]ISO/IEC 10367의 동등한 세트를 사용해야 한다고 규정하고 있다.
ISO/IEC 10367:1991은 ASCII뿐만 아니라 ISO/IEC 6937(ITU T.51) 및 ISO/IEC 8859 파트 1~9(즉, 1991년 발행 당시 존재했던 부분)의 우측(ASCII가 아닌 부분)에 사용되는 G1 세트에 일치하는 세트를 포함한다. 추가 문자)문자(아래 [2][4]참조)
보충 G3 라틴어 세트
ISO/IEC 10367은 ISO-IR-154 그래픽 세트를 포함하고 있으며, 이는 라틴어 알파벳 번호 1, 2, 5(ISO-8859-1, ISO-8859-2 및 ISO-8859-9)[4]를 보완하기 위한 것입니다.구체적으로는 ISO/IEC 4873 프로파일의 G3 세트로 사용하기 위한 것입니다.G1 세트와 G2 세트는 ISO-8859-2의 우측과 ISO-8859-1 또는 ISO-8859-9의 [5]우측을 포함합니다.이러한 설정은 스페이싱 코드가 [6]없는 ISO/IEC 6937 레퍼토리(ITU T.51 Annex A) 전체를 나타냅니다.
예를 들어 문자 δ는 ISO/IEC 4873 레벨2에 따라 다음과 같이 부호화됩니다.0x8F 0x23
이 세트가 포함되어 있는 경우.
강조 표시된 문자는 ISO-8859-1 또는 ISO-8859-9에도 표시됩니다.현재의 ISO/IEC 4873/ECMA-43([7]이전 버전 아님)에서는, 문자가 표시되는 최저 번호의 작업 세트로부터 사용할 필요가 있습니다.따라서 각 ISO-8859 의 우측 세트가 G1 또는 G2 [8]세트로 사용되는 경우, 이러한 문자는 이 G3 세트로부터 사용되지 않습니다.
ISO/IEC 10367 보충 G3 라틴어[5] 세트 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
축당 2배 | ā | Ĉ | Ċ | Ė | Ē | Ĝ | ‘ | “ | ™ | ← | ↑ | → | ↓ | |||
3배/B배 | 아 | ĉ | ċ | ð | ė | ē | ĝ | ’ | ” | ♪ | ⅛ | ⅜ | ⅝ | ⅞ | ||
4배속/Cx | Ğ | Ġ | Ģ | Ĥ | Ħ | Ĩ | I i | Ī | Į | IJ | Ĵ | Ķ | Ļ | Ŀ | Ņ | |
5배속/깊이 | — | Ŋ | O | Œ | Ŗ | Ŝ | Ŧ | Þ | Ũ | Ŭ | ū | Ų | Ŵ | Ý | Ŷ | Ÿ |
6배속/Ex | Ω | ğ | ġ | ģ | ĥ | ħ | ĩ | ı | ī | į | ij | ĵ | ķ | ļ | ŀ | ņ |
7x/Fx | ĸ | ŋ | o | œ | ŗ | ŝ | ŧ | þ | ũ | ŭ | u | ų | ŵ | ý | ŷ | ʼn |
상자 도면 세트
ISO/IEC 2022에서 ISO-IR-155로 사용하도록 등록된 ISO/IEC 10367의 박스 도면 세트는 다음과 같습니다.0x20/A0 또는 0x7F/FF 위치는 사용하지 않지만 96자 [9]세트로 등록됩니다.
Perl libintl에는 "ISO_10367-BOX" 코덱이 포함되어 있습니다.그러면 ASCII over GL 및 ISO-IR-155 박스 도면 세트가 몇 가지 편차로 인코딩/디코딩됩니다.구체적으로는 굵은 줄의 문자 대신 두 줄의 상자 그리기 문자를 포함하고 있으며, 0xCB의 위쪽 절반 블록())을 "유닛 스페이스 B"[10]로 문서화된 전용 문자 U+E019로 대체한다.
ISO/IEC 10367 박스 도면[9] 세트 | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
축당 2배 | ||||||||||||||||
3배/B배 | ||||||||||||||||
4배속/Cx | ┃ | ━ | ┏ | ┓ | ┗ | ┛ | ┣ | ┫ | ┳ | ┻ | ╋ | ▀ | ▄ | █ | ▪ | |
5배속/깊이 | │ | ─ | ┌ | ┐ | └ | ┘ | ├ | ┤ | ┬ | ┴ | ┼ | ░ | ▒ | ▓ | ||
6배속/Ex | ||||||||||||||||
7x/Fx |
레퍼런스
- ^ ISO/IEC JTC 1/SC 2 (1991). "Information technology — Standardized coded graphic character sets for use in 8-bit codes". ISO. ISO/IEC 10367:1991.
- ^ a b van Wingen, Johan W (1999). "8. Code Extension, ISO 2022 and 2375, ISO 4873 and 10367". Character sets. Letters, tokens and codes. Terena. Archived from the original on 2020-08-01.
- ^ ISO/IEC JTC 1/SC 2 (1998-02-12). Final Text of DIS 8859-10, Information Technology — 8-bit single-byte coded graphic character sets — Part 10: Latin alphabet No. 6 (PDF). ISO/IEC FDIS 8859-10:1998, JTC1/SC2 N2992, WG3 N415.
- ^ a b "8-Bit Character Sets - ISO/IEC 10367". Guide to the use of Character Sets in Europe. DKUUG.
- ^ a b ECMA (1990-03-01). Supplementary Set for Latin Alphabets 1, 2 and 5 (PDF). ITSCJ/IPSJ. ISO-IR-154.
- ^ ISO/IEC JTC 1/SC 2/WG 3 (1998-04-15). "Annex E: Alternative coded representation of the repertoire with no non-spacing diacritical marks". WD 6937, Coded graphic character set for text communication - Latin alphabet (PDF). p. 37. JTC1/SC2/N454.
- ^ ECMA (1991). "Main differences between the second edition (1985) and the present (third) edition of this ECMA Standard". ECMA-43: 8-Bit Coded Character Set Structure and Rules (PDF) (ECMA Standard) (3rd ed.). p. 23.
- ^ ECMA (1991). "Unique coding of characters". ECMA-43: 8-Bit Coded Character Set Structure and Rules (PDF) (ECMA Standard) (3rd ed.). p. 10.
- ^ a b ISO/IEC/JTC1/SC2/WG3 (1990-04-16). Basic Box-Drawings Set (PDF). ITSCJ/IPSJ. ISO-IR-155.
- ^ Flohr, Guido. "Conversion routines for ISO_10367_BOX". libintl-perl. Locale::RecodeData::ISO_10367_BOX.