평면(유니코드)
Plane (Unicode)이 기사는 검증을 위해 추가적인 인용이 필요합니다. : – · · · (2016년 7월) (이 를 및 |
유니코드 표준에서 평면은 65,536 (216)개의 코드 포인트들의 연속적인 그룹입니다.숫자 0~16으로 식별되는 17개의 평면이 있으며, 이 평면은 6개의 위치 16진수 형식(U+hhhhhhhhh)에서 처음 두 위치 중 가능한16 값 00~10에 해당합니다.평면 0은 가장 일반적으로 사용되는 문자를 포함하는 BMP(기본 다국어 평면)입니다.상위 평면 1부터 16까지는 "보조 평면"이라고 불립니다.[1]유니코드의 마지막 코드 포인트는 평면 16의 마지막 코드 포인트인 U+10FFFF입니다.유니코드 버전 15.1에서는 평면 중 5개가 코드 포인트(문자)를 할당했으며 7개가 이름이 붙여졌습니다.
17개의 플레인의 한계는 UTF-16으로 인한 것으로, 2개의20 코드 포인트(16개의 플레인)를 워드 쌍으로 인코딩하고 BMP를 단일 워드로 인코딩할 수 있습니다.[2]UTF-8은 2 (231,147,483,648) 코드 포인트 (32,768 평면)의 훨씬 더 큰 제한으로 설계되었으며, 현재 4 바이트의 제한 하에서도 여전히 221 (2,097,152) 코드 포인트 (32 평면)를 인코딩할 수 있습니다.[3]
17대의 비행기는 1,114,112개의 코드 포인트를 수용할 수 있습니다.이 중 2,048명은 대리모(UTF-16에서 쌍을 만드는 데 사용됨)이고, 66명은 비문자이며, 137,468명은 민간용으로 예약되어 있으며, 974,530명은 공공용으로 남겨져 있습니다.
평면은 평면과 달리 고정된 크기가 없는 유니코드 블록으로 더 세분됩니다.유니코드 15.1에 정의된 328개의 블록은 가능한 코드 포인트 공간의 26%를 커버하며, 최소 16개의 코드 포인트(16개의 블록)에서 최대 65,536개의 코드 포인트(Supplementary Private Use Area-A 및 -B)까지 크기가 다양합니다(Supplementary Private Use Area-A 및 -B는 평면 15 및 16 전체를 구성합니다).미래의 사용을 위해, 다양한 문자들이 대부분의 알려진 현재 및 고대 문자 시스템에 대해 잠정적으로 매핑되었습니다.[4]
개요
할당된 문자
비행기 | 할당된 코드 포인트[note 1] 버전 15.0 | 할당된 문자 |
---|---|---|
0 BMP | 65,520 | 55,639 |
SMP 1개 | 26,160 | 23,276 |
2 SIP | 61,536 | 61,495 |
3 TIP | 9,136 | 9,131 |
14 SSP | 368 | 337 |
15 SPUA-A | 65,536 | 0 (정의상) |
16 SPUA-B | 65,536 | 0 (정의상) |
합계 | 293,792 | 149,878 |
기본 다국어 평면

첫 번째 평면인 0 평면인 BMP(Basic Multilinguation Plane)는 거의 모든 현대 언어의 문자와 많은 수의 기호를 포함합니다.BMP의 주요 목표는 쓰기를 위한 문자뿐만 아니라 이전 문자 집합의 통합을 지원하는 것입니다.BMP에서 할당된 코드 포인트의 대부분은 중국어, 일본어 및 한국어(CJK) 문자를 인코딩하는 데 사용됩니다.
높은 대리자(U+D800–U+DBFF) 및 낮은 대리자(U+DC00–U+DFFF) 코드는 UTF-16에서 높은 대리자와 낮은 대리자의 16비트 코드 쌍을 사용하여 BMP가 아닌 문자를 인코딩하는 데 사용됩니다.단일 대리 코드 포인트에는 문자가 할당되지 않습니다.
이 평면에 있는 65,536개의 코드 포인트 중 65,520개가 유니코드 블록에 할당되었으며, 단 하나의 할당되지 않은 범위(2FE0..2FEF).
유니코드 15.1[update] 현재 BMP는 다음 164개의 블록으로 구성되어 있습니다.
- 왼쪽에서 오른쪽으로 알파벳 스크립트:
- 기본 라틴어 (ISO/IEC 8859-1의 하위 절반: ISO/IEC 646:1991-IRV aka ASCII) (0000–007F)
- 라틴-1 보충제 (ISO/IEC 8859-1의 상반부) (0080–00)FF)
- 라틴익스텐디드-A(0100-017F)
- 라틴익스텐디드-B(0180-024F)
- IPA 확장 (0250–02)AF)
- 간격 조절 문자 (02B0–02)FF)
- 다이아크리티컬 마크 결합 (0300–036F)
- 그리스어와 콥트어 (0370–03)FF)
- 키릴 문자 (0400–04)FF)
- 키릴보조식품(0500-052F)
- 아르메니아어 (0530-058F)
- 셈족의 압자 및 기타 오른쪽에서 왼쪽으로의 스크립트:
- 브라만 문자:
- 그 밖의 알파벳 또는 음절 문자 좌-우:
- 필리핀 스크립트:
- 크메르 (1780–17)FF)
- 몽골인 (1800–18)AF)
- 통합 캐나다 원주민 강의 계획서 확장 (18B0–18)FF)
- 브라만 문자:
- 림부 (1900-194)F)
- Tai 스크립트:
- 확장된 투석기 마크 결합(1AB0–1AFF)
- 인도네시아어 스크립트:
- 렙차(1C00–1C4)F)
- 올치키(1C50–1C7)F)
- 기타 좌에서 우로 알파벳 또는 음절 보조어:
- 키릴 익스텐디드-C(1C80–1C8)F)
- 조지아 확장(1C90–1CBF)
- 순단 보조제 (1CC0-1CCF)
- 베딕 익스텐션(1CD0–1CFF)
- 그 밖의 왼쪽에서 오른쪽으로 알파벳을 보충합니다.
- 음성 확장(1D00–1D7)F)
- 폰틱 익스텐션 보조 (1D80–1DBF)
- 합성 Diacritical Marks 부록 (1DC0–1DFF)
- 라틴어 확장 추가 (1E00–1EFF)
- 그릭익스텐디드(1F00–1FFF)
- 기호:
- 일반 구두점 (2000-206F)
- 위첨자 및 구독자 (2070–209)F)
- 통화 기호(20A0–20)CF)
- 기호에 대한 구분 기호 조합(20D0–20)FF)
- 글자 같은 기호 (2100–214F)
- 숫자 양식 (2150-218F)
- 화살표 (2190–21)FF)
- 수학 연산자 (2200–22)FF)
- 기타 테크니컬 (2300-23)FF)
- 컨트롤 픽처스(2400-243)F)
- 광학식 문자인식 (2440-245F)
- 동봉된 알파벳 숫자 (2460–24)FF)
- 박스도면(2500-257F)
- 블록 요소(2580–259)F)
- 기하학적 모양 (25A0-25)FF)
- 기타 기호(2600–26)FF)
- 딩바츠 (2700-27)BF)
- 기타 수학 기호-A(27C0–27)EF)
- 보조 화살표-A(27F0-27)FF)
- 점자 패턴 (2800–28)FF)
- 보조 화살표-B(2900–297)F)
- 기타 수학 기호-B(2980–29)FF)
- 보충 수학 연산자(2A00–2A)FF)
- 기타 기호 및 화살표(2B00–2B)FF)
- 기타 좌에서 우로 알파벳 스크립트 또는 부록:
- 글래고틱 (2C00–2C5F)
- 라틴어 익스텐디드-C(2C60–2C7)F)
- 콥틱(2C80–2CFF)
- 조지아 보충제 (2D00–2D2)F)
- 아프리카 스크립트:
- 그 밖의 왼쪽에서 오른쪽으로 알파벳을 보충합니다.
- 키릴식 익스텐디드-A(2DE0–2DFF)
- 보충 구두점 (2E00–2E7F)
- CJK 스크립트 및 기호:
- CJK 라디칼보조제 (2E80–2EFF)
- 강시 래디칼(2F00-2FDF)
- 도형 설명 문자(2FF0–2FFF)
- CJK 기호 및 구두점 (3000~303F)
- 히라가나 (3040–309)F)
- 카타카나(30A0-30)FF)
- 보포모포(3100-312F)
- 한글 호환자모 (3130-318F)
- 칸분 (3190년 ~ 319년)F)
- 보포모포익스텐디드(31A0-31)BF)
- CJK 스트로크 (31C0-31)EF)
- 가타카나 폰틱 익스텐션 (31F0-31)FF)
- 동봉된 CJK 편지 및 월(3200-32)FF)
- CJK 호환성 (3300-33)FF)
- CJK 통합아이디어스 확장자 A (3400–4DBF)
- 이징 육각 기호(4DC0–4DFF)
- CJK 통합아이디어스 (4E00–9)FFF)
- 이 음절 (A000–A48)F)
- 이 래디칼 (A490–A4)CF)
- 리수(A4D0–A4)FF)
- 아프리카 스크립트:
- 바이 (A500–A63)F)
- 그 밖의 왼쪽에서 오른쪽으로 알파벳을 보충합니다.
- 키릴 확장-B (A640–A69)F)
- 아프리카 스크립트:
- 밤음(A6A0-A6)FF)
- 그 밖의 왼쪽에서 오른쪽으로 알파벳을 보충합니다.
- 브라만 문자:
- 실로티 나그리(A800~A82F)
- 공통 지시 번호 양식 (A830–A83)F)
- 파그스파 (A840–A87)F)
- 사우라슈트라 (A880–A8DF)
- 데바나가리 익스텐디드(A8E0–A8)FF)
- 카야리(A900-A92)F)
- 리장(A930-A95)F)
- 한글자모익스텐디드-A (A960–A97)F)
- 브라만 문자:
- 에티오피아 확장 A(AB00–AB2)F)
- 라틴어 확장-E(AB30–AB6)F)
- 체로키 보충제 (AB70–AB)BF)
- Meetei Mayek (ABC0–AB)FF)
- 한글 음절 (AC00–D7)AF)
- 한글자모익스텐디드-B (D7B0–D7)FF)
- 대리모:
- 전용면적 (E000–F8)FF)
- CJK 호환기호 (F900-FA)FF)
- 알파벳 프레젠테이션 양식(FB00–FB4)F)
- 아랍어 프레젠테이션 양식-A(FB50–FDFF)
- 변동 선택기(FE00–FE0F)
- 세로형태 (FE10-FE1F)
- 하프마크 결합 (FE20–FE2F)
- CJK 호환 양식 (FE30–FE4F)
- 작은 형태 변형 (FE50–FE6F)
- 아랍어 프레젠테이션 양식-B(FE70–FEFF)
- 반치폭 및 전폭 형태(FF00–FFEF)
- 스페셜(FFF0–FFF)
부가 다국어 평면

평면 1, SMP(Supplementary Multilinguation Plane)는 이력 스크립트(CJK ideographic 제외)와 특정 필드 내에서 사용되는 기호 및 표기를 포함합니다.스크립트에는 선형 B, 이집트 상형문자, 설형문자 등이 있습니다.또한 샤비안과 데세레트와 같은 영어 개혁 철자법과 오세이지, 와랑씨티, 아들람, 완초, 토토와 같은 현대 대본도 포함되어 있습니다.기호와 표기법에는 역사적이고 현대적인 음악 표기법, 수학적 알파벳 숫자법, 속기법, 이모지 및 기타 그림 세트, 카드, 마작 및 도미노 게임 기호가 포함됩니다.
유니코드 15.1[update] 현재 SMP는 다음과 같은 151개의 블록으로 구성되어 있습니다.
- 고대 그리스어 및 기타 좌우 문자:
- 선형B 음절(10000-1007F)
- 선형 B 다이어그램(10080–100)FF)
- 에게 해 숫자 (10100–1013F)
- 고대 그리스 숫자 (10140–1018F)
- 고대 기호 (10190–101)CF)
- 파이스토스 디스크 (101D0-101)FF)
- 라이시안 (10280-1029F)
- 캐리안(102A0-102)DF)
- 콥트 효과 번호(102E0-102)FF)
- 구 이탤릭체 (10300-1032F)
- 고딕(1030-1034F)
- 올드 퍼믹 (10350-1037F)
- 우가라이트 (10380-1039F)
- 올드 페르시안 (103A0-103)DF)
- 디저트 (10400-1044F)
- 샤비안 (10450-1047F)
- 오스만야 (10480–104)AF)
- 오세이지(104B0-104)FF)
- 엘바산(10500-1052F)
- 캅카스 알바니아어 (10530–1056F)
- 비트쿠키 (10570–105)BF)
- 리니어A (10600-1077F)
- 라틴어 익스텐디드-F(10780–107)BF)
- 오른쪽에서 왼쪽으로 스크립트:
- 키프로스 섬 (10800–1083F)
- 임페리얼 아람어 (10840-1085F)
- 팔미렌(10860-1087F)
- 나바타에안 (10880–108)AF)
- 햇란(108E0-108)FF)
- 페니키아 (10900–1091F)
- 리디아 (10220-1093F)
- 메로이트 상형문자 (10980-1099F)
- 메로이틱 필기체 (109A0-109)FF)
- 카로쉬티(10A00-10A5F)
- 구남아리안 (10A60–10A7F)
- 올드 북아라비아 (10A80–10A9F)
- 마니채안 (10AC0–10AFF)
- 아베스탄 (10B00–10B3F)
- 비문 파르티아 (10B40–10B5F)
- 비문 팔라비 (10B60–10B7F)
- 살터 팔레비 (10B80–10B)AF)
- 올드 튀르크 (10C00–10C4F)
- 구 헝가리어(10C80–10CFF)
- 하니피 로힝야 (10D00-10D3F)
- 루미 숫자기호 (10E60–10E7F)
- 예지디 (10E80-10EBF)
- 아랍어익스텐디드-C(10EC0–10EFF)
- 올드 소그디안(10F00-10F2F)
- 소그디안(10F30–10F6F)
- 올드 위구르 (10F70-10FAF)
- 초라스미안 (10FB0–10FDF)
- 엘리매틱 (10FE0–10FF)
- 브라만 문자:
- 브라흐미 (11000–1107F)
- 카이티 (11080–110)CF)
- 소라솜펭(110D0-110)FF)
- 짜끄마 (11100–1114F)
- 마하자니 (11150–1117F)
- 샤라다 (11180년 ~ 111년)DF)
- 신할라 고대 숫자 (111E0-111)FF)
- 호지키(11200-1124F)
- 물타니 (11280–112)AF)
- 쿠다와디 (112B0-112)FF)
- 그란타 (11300–1137F)
- 뉴아 (11400-1147F)
- 티르후타 (11480–114)DF)
- 싯담(11580~115)FF)
- 모디 (11600–1165F)
- 몽골식 보약 (11660-1167F)
- 타크리 (11680–116)CF)
- 아홈(11700-1174F)
- 도그라(11800~1184F)
- 와랑씨티 (118A0-118)FF)
- 다이브스아쿠루 (11900-1195F)
- 난디나가리 (119A0-119)FF)
- 자나바자르 스퀘어 (11A00-11A4F)
- 소욤보 (11A50-11)AAF)
- 통합 캐나다 원주민 강의 계획서 확장-A (11AB0-11ABF)
- 브라만 문자:
- 리수 보충 (11FB0-11FBF)
- 타밀어 보충제 (11FC0–11FF)
- 설형문자:
- 설형 (12000–123)FF)
- 설형 숫자와 구두점 (12400–1247F)
- 초기 왕조의 설형 (12480–1254F)
- 사이프로미노안(12F90-12)FFF)
- 상형문자:
- 이집트 상형문자 (13000–1342F)
- 이집트 상형문자 형식 제어 (13430–1345F)
- 아나톨리아 상형문자 (14400–1467F)
- 바움보충제 (16800-16A3F)
- Mro(16A40-16A6F)
- 탕사(16A70-16ACF)
- 바사바 (16AD0–16AFF)
- 파하흐몽(16B00-16B8F)
- 메데파이드린(16E40-16E9F)
- 미아오(16F00-16F9F)
- 동아시아 스크립트:
- Ideographic 기호 및 구두점 (16FE0–16FF)
- 탕구트 (17000–187)FF)
- Tangut 구성품 (18800–18)AFF)
- 거탄 작은 대본 (18B00–18CFF)
- 탕구트 보충제 (18D00-18D7F)
- 카나익스텐디드-B(1AFF0–1AFF)
- 카나보조식품 (1B000–1B0)FF)
- 카나익스텐디드-A (1B100–1B12F)
- 스몰 카나 익스텐션 (1B130–1B16F)
- 누슈(1B170–1B2)FF)
- 표기법 쓰기 시스템:
- 기호 및 숫자:
- 음악 표기법:
- 즈나메니 음악 표기법 (1CF00–1CFCF)
- 비잔틴 음악 기호 (1D000–1D0)FF)
- 음악 기호 (1D100–1D1)FF)
- 고대 그리스 음악 표기법 (1D200–1D24F)
- 카토비크 숫자 (1D2C0–1D2)DF)
- 마야 숫자 (1D2E0–1D2)FF)
- 수학 기호:
- Tai Xuan Jing 심볼 (1D300–1D35F)
- 카운트 로드 번호(1D360–1D37F)
- 수학적 영숫자 기호(1D400–1D7)FF)
- 음악 표기법:
- 표기법 쓰기 시스템:
- 서튼사인글씨 (1D800–1DA)AF)
- 기타 좌에서 우로 스크립트:
- 라틴어 확장-G(1DF00–1DFFF)
- 글래고틱보조식품 (1E000–1E02F)
- 키릴 익스텐디드-D(1E030–1E08F)
- 냐켄 푸아츄에몽 (1E100-1E14F)
- 토토 (1E290–1E2)BF)
- 완초(1E2C0-1E2)FF)
- 나그문다리(1E4D0-1E4)FF)
- 아프리카 스크립트:
- 에티오피아식 확장-B(1E7E0–1E7)FF)
- 멘데 키카쿠이(1E800-1E8)DF)
- 애들램 (1E900–1E95F)
- 기호 및 숫자:
- 지시 Siyaq 숫자 (1EC70–1ECBF)
- 오스만 시야크 숫자 (1ED00–1ED4)F)
- 아랍어 수학 알파벳 기호(1EE00–1EEFF)
- 게임 타일 및 카드:
- 동봉된 영숫자 부록 (1F100–1F1)FF)
- 동봉된 아이디얼 부록 (1F200–1F2)FF)
- 기타기호 및 픽토그래프(1F300–1F5)FF)
- 이모티콘(1F600-1F64F)
- 장식 딩배츠 (1F650-1F67F)
- 운송 및 지도 기호 (1F680–1F6)FF)
- 알케미컬 심볼 (1F700–1F77F)
- 기하학적 모양 확장 (1F780–1F7)FF)
- 보조 화살표-C(1F800–1F8)FF)
- 보조기호 및 픽토그래프(1F900–1F9)FF)
- 체스 기호 (1FA00–1FA6F)
- 심볼 및 픽토그래프 익스텐디드-A (1FA70–1FA)FF)
- 레거시 컴퓨팅을 위한 기호(1FB00–1FB)FF)
부가적 이념면

평면 2(Supplementary Ideographic Plane, SIP)는 이전의 문자 인코딩 표준에 포함되지 않았던 CJK 아이데그래프(CJK Unified Ideographics)에 사용됩니다.
유니코드 15.1을[update] 기준으로 SIP는 다음과 같은 7개의 블록으로 구성되어 있습니다.
- CJK 통합아이디어스 확장B (200000-2A6)DF)
- CJK 통일아이디어스 익스텐션 C (2A700-2B73F)
- CJK 통합아이디어스 익스텐션 D (2B740–2B81F)
- CJK 통합아이디어스 확장 E (2B820-2CE)AF)
- CJK 통합아이디어스 확장F (2CEB0-2EB)EF)
- CJK 통합아이디어스 확장자 I (2EBF0-2EE5F)
- CJK 호환 아이데그래프 부록 (2F800-2FA1F)
삼차이상학 평면

평면 3은 TIP(Trial Ideographic Plane)입니다.2020년 3월에 출시된 유니코드 13.0에서 CJK Unified Ideographes Extension G가 TIP에 추가되었습니다.[5]또한 Oracle Bone 스크립트와 Small Seal 스크립트를 위해 잠정적으로 할당됩니다.[6]
유니코드 15.1을[update] 기준으로 TIP는 다음과 같은 두 개의 블록으로 구성됩니다.
- CJK 통합아이디어스 익스텐션 G (30000-3134F)
- CJK 통합아이디어스 확장 H (3135년 ~ 323년)AF)
할당되지 않은 평면
평면 4 ~ 13 (평면)4 ~ D(16진수):아직 비행기 4~13에 할당되거나 할당 제안된 문자가 없습니다.
보조특수목적면

14면(16진수로 E)은 SSP(Supplementary Special-Purpose Plane)로 지정됩니다.유니코드 15.1[update] 기준으로 다음과 같은 두 개의 블록으로 구성됩니다.
개인 사용 영역 평면
두 평면 15 및 16(16진수로 된 평면 F 및 10)에는 각각 "개인 사용 영역"이 포함됩니다.여기에는 보조 개인 사용 영역-A(PUA-A) 및 -B(PUA-B)라는 이름의 블록이 포함됩니다.개인 사용 영역은 ISO 및 유니코드(개인 문자 인코딩) 외부에서 사용할 수 있습니다.
참고문헌
- ^ "Glossary". www.unicode.org. Retrieved 2021-09-27.
- ^ 유니코드 표준 https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf 의 표 3.5 "UTF-16 비트 배포" 참조
- ^ 유니코드 표준 https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf 의 표 3.6 "UTF-8 비트 분포" 참조
- ^ "Roadmaps to Unicode". www.unicode.org. Retrieved 2021-09-27.
- ^ "Announcing The Unicode Standard, Version 13.0".
- ^ "Proposed New Characters: The Pipeline". www.unicode.org.