타이탐 (유니코드 블록)
Tai Tham (Unicode block)타이탐 | |
---|---|
범위 | U+1A20..U+1AF (암호 코드 포인트) |
평면 | BMP |
스크립트 | 타이탐 |
주요 문자 | 타이탐 |
맡겨진 | 127 코드 포인트 |
사용되지 않음 | 예약된 코드 포인트 17개 |
유니코드 버전 기록 | |
5.2 (2009) | 127 (+127) |
차트 | |
코드 차트 | |
참고: |
타이탐은 북태어(캄무앙), 타이 뤼(Tai Lü), 쿤(Khün)을 쓰는 데 사용되는 라나 문자(Lanna Script)의 문자를 담은 유니코드 블록이다.
타이탐[1][2] 공식 유니코드 컨소시엄 코드 차트(PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+1A2x | ᨠ | ᨡ | ᨢ | ᨣ | ᨤ | ᨥ | ᨦ | ᨧ | ᨨ | ᨩ | ᨪ | ᨫ | ᨬ | ᨭ | ᨮ | ᨯ |
U+1A3x | ᨰ | ᨱ | ᨲ | ᨳ | ᨴ | ᨵ | ᨶ | ᨷ | ᨸ | ᨹ | ᨺ | ᨻ | ᨼ | ᨽ | ᨾ | ᨿ |
U+1A4x | ᩀ | ᩁ | ᩂ | ᩃ | ᩄ | ᩅ | ᩆ | ᩇ | ᩈ | ᩉ | ᩊ | ᩋ | ᩌ | ᩍ | ᩎ | ᩏ |
U+1A5x | ᩐ | ᩑ | ᩒ | ᩓ | ᩔ | ᩕ | ᩖ | ᩗ | ᩘ | ᩙ | ᩚ | ᩛ | ᩜ | ᩝ | ᩞ | |
U+1A6x | ᩠ | ᩡ | ᩢ | ᩣ | ᩤ | ᩥ | ᩦ | ᩧ | ᩨ | ᩩ | ᩪ | ᩫ | ᩬ | ᩭ | ᩮ | ᩯ |
U+1A7x | ᩰ | ᩱ | ᩲ | ᩳ | ᩴ | ᩵ | ᩶ | ᩷ | ᩸ | ᩹ | ᩺ | ᩻ | ᩼ | ᩿ | ||
U+1A8x | ᪀ | ᪁ | ᪂ | ᪃ | ᪄ | ᪅ | ᪆ | ᪇ | ᪈ | ᪉ | ||||||
U+1A9x | ᪐ | ᪑ | ᪒ | ᪓ | ᪔ | ᪕ | ᪖ | ᪗ | ᪘ | ᪙ | ||||||
U+1Ax | ᪠ | ᪡ | ᪢ | ᪣ | ᪤ | ᪥ | ᪦ | ᪧ | ᪨ | ᪩ | ᪪ | ᪫ | ᪬ | ᪭ | ||
메모들
|
역사
처음에 인코딩된 127개의 코드 포인트 중 123개가 L2/07-007R로 제안되었고,[3] 2/08-037R2에서는[4] 2개(U+1A5C 및 U+1A7C)가 더 제안되었으며, L2/08-037R2에서는 최종 쌍(U+1A5D 및 U+1A5E)이 제안되었다.[5]이 세 가지 문서 중 마지막은 세 가지 문서 중 첫 번째 문서인 U+1A37과 U+1A38의 정의를 수정하였다.
다음의 유니코드 관련 문서는 타이탐 블록에서 특정 문자를 정의하기 위한 목적과 과정을 기록한다.
버전 | 최종코드 포인트[a] | 카운트 | L2 ID | WG2 ID | 문서 |
---|---|---|---|---|---|
5.2[b] | U+1A20..1A5E, 1A60..1A7C, 1A7F..1A89, 1A90..1A99, 1AA0..1AAD | 127 | L2/99-245 | N2042년 | Everson, Michael; McGowan, Rick (1999-07-20), Unicode Technical Report #3: Early Aramaic, Balti, Kirat (Limbu), Manipuri (Meitei) and Tai Lü scripts |
X3L2/94-088 | N1013 | The Motion on the Coding of the Old Xishuang Banna Dai Writing, Entering into BMP of ISO/IEC 10646, 1994-04-18 | |||
N1099(pdf, doc) | The motion on coding of the Old Xishuang Banna Dai Writing Entering into BMP of ISO/IEC 10646, 1994-10-10 | ||||
L2/04-351 | Hosken, Martin (2004-06-28), Lanna Unicode: A Draft Proposal | ||||
L2/05-095R | Hosken, Martin (2005-04-25), Lanna Unicode: A Proposal | ||||
L2/05-166 | Kourilsky, G.; Berment, V. (2005-07-15), Towards a Computerization of the Lao Tham System of Writing | ||||
L2/05-188 | Hosken, Martin (2005-08-02), Lao Tham in Terms of Lanna: a response to L2/05-166 from L2/05-095 | ||||
L2/06-258R | N3121R | Everson, Michael; Hosken, Martin (2006-09-09), Proposal for encoding the Lanna script in the BMP of the UCS | |||
L2/06-311 | N3159 | Tun, Ngwe (2006-09-20), Response to N3121R: Proposal for encoding the Lanna script in the BMP of the UCS | |||
L2/06-319 | N3111 | Opinions on N3121-Lanna script, 2006-09-22 | |||
L2/06-320 | N3169R | Chen, Zhuang; Everson, Michael; Hosken, Martin; Wei, Lin-Mei (2006-09-26), Lanna ad-hoc report | |||
N3153(pdf, doc) | Umamaheswaran, V. S. (2007-02-16), "M49.17", Unconfirmed minutes of WG 2 meeting 49 AIST, Akihabara, Tokyo, Japan; 2006-09-25/29 | ||||
L2/07-015 | Moore, Lisa (2007-02-08), "Lanna (C.17)", UTC #110 Minutes | ||||
L2/07-007R | N3207 | Everson, Michael; Hosken, Martin; Constable, Peter (2007-03-21), Revised proposal for encoding the Lanna script in the BMP of the UCS | |||
L2/07-101 | N3238 | Proposing on Encoding Old Tai Lue, 2007-04-03 | |||
L2/07-098 | N3239 | Response to Chinese contribution N3238, "Proposing on Encoding Old Tai Lue", 2007-04-11 | |||
N3353(pdf, doc) | Umamaheswaran, V. S. (2007-10-10), "M51.2", Unconfirmed minutes of WG 2 meeting 51 Hanzhou, China; 2007-04-24/27 | ||||
L2/07-118R2 | Moore, Lisa (2007-05-23), "111-C17", UTC #111 Minutes | ||||
L2/07-268 | N3253(pdf, doc) | Umamaheswaran, V. S. (2007-07-26), "M50.10", Unconfirmed minutes of WG 2 meeting 50, Frankfurt-am-Main, Germany; 2007-04-24/27 | |||
L2/07-307 | N313 | Comments on Lanna encoding in FPDAM4, 2007-09-06 | |||
L2/07-316 | N3342 | Hosken, Martin (2007-09-10), Response to N3313 | |||
L2/07-319 | N3346 | Ad hoc report on Lanna, 2007-09-19 | |||
L2/07-322 | N3349R | Everson, Michael (2007-09-28), "Tai Tham", Summary of repertoire for FPDAM 5 of ISO/IEC 10646:2003 and future amendments | |||
L2/07-345 | Moore, Lisa (2007-10-25), "Consensus 113-C10", UTC #113 Minutes | ||||
L2/07-353 | Whistler, Ken (2007-10-10), "A. Lanna (FDAM 4 and FPDAM 5)", WG2 Consent Docket | ||||
L2/08-037R2 | N3379R2 | Constable, Peter (2008-04-18), Tai Tham Ad-hoc Meeting Report | |||
L2/08-073 | N3384 | Hosken, Martin (2008-01-28), Tai Tham Subjoined Variants | |||
L2/08-003 | Moore, Lisa (2008-02-14), "Tai Tham", UTC #114 Minutes | ||||
L2/08-318 | N3453(pdf, doc) | Umamaheswaran, V. S. (2008-08-13), "M52.2a", Unconfirmed minutes of WG 2 meeting 52 | |||
L2/14-126 + 부록 | Pournader, Roozbeh (2014-05-02), Improvements requested for Unicode Indic properties (two text file appendices HERE) [영향 U+1A55, 1A60, 1A80-1A89, 1A90-1A99] | ||||
L2/14-177 | Moore, Lisa (2014-08-21), "B.14.5", UTC #140 Minutes [영향 U+1A56-1A5E, 1A75-1A7C, 1A7F] | ||||
L2/17-120 | Wordingham, Richard (2017-05-01), Corrections to the Indic Syllabic Category for the Tai Tham Script [영향 U+1A57, 1A5A-1A5E, 1A74, 1A7A] | ||||
L2/17-169 | Pournader, Roozbeh (2017-05-12), Proposed Indic Syllabic Category changes for Tai Tham for Unicode 10 [영향 U+1A57, 1A5A-1A5E, 1A74, 1A7A] | ||||
L2/17-103 | Moore, Lisa (2017-05-18), "B.14.9", UTC #151 Minutes [영향 U+1A57, 1A5A-1A5E, 1A74, 1A7A] | ||||
L2/18-053 | Pournader, Roozbeh (2018-01-24), New Indic Syllabic Category Consonant_Initial_Postfixed [영향 U+1A5A] | ||||
L2/18-007 | Moore, Lisa (2018-03-19), "B.14.7", UTC #154 Minutes [영향 U+1A5A] | ||||
L2/18-171 | Wordingham, Richard (2018-04-29), Positioning of Tai Tham Vowels Below [문서 U+1A69 & U+1A6A] | ||||
L2/18-241 | Anderson, Deborah; et al. (2018-07-25), "15. Tai Tham", Recommendations to UTC # 156 July 2018 on Script Proposals [문서 U+1A69 & U+1A6A] | ||||
L2/18-183 | Moore, Lisa (2018-11-20), "D.12 Positioning of Tai Tham vowels below", UTC #156 Minutes [문서 U+1A69 & U+1A6A] | ||||
첨자 자음 부호화
밑자음과 첨자는 외양과 음이 모두 다르기 때문에 인코딩이 다르다.첨자 자음은 2자의 순서로 인코딩된다.두 번째는 기본 캐릭터, 첫 번째는 특수 캐릭터 U+1A60 TAI THAM SIGN SAKOT이다.[3]: Section 2
자음에는 두 개의 첨자 형식이 있고 선택이 의미에 영향을 미치는 경우, 일반적으로 음절 최종 자음에 사용되는 형태는 SAKOT로 인코딩되며, 다른 형태는 자체 코드 포인트를 갖게 된다.이런 식으로 첨자 형태가 다른 자음은 7개로, 즉 namely RA, ᩃ LA, ba BA, ᩈ HIGH SA, ma MA, high HIGH RATA, low LOW PA이다.
ᨣᩕ(북태어 발음: [kʰuː]) is encoded as <U+1A23 LOW KA, U+1A55 MEDIAL RA, U+1A6A SIGN UU> but ᨠᩣ᩠ᩁ (IPA: [kaːn]) is encoded as <U+1A20 HIGH KA, U+1A63 SIGN AA, U+1A60 SAKOT, U+1A41 RA>[3]: Section 4
ᩆᩦ᩠ᩃ (IPA: [siːn]) is encoded as <U+1A46 HIGH SHA, U+1A66 SIGN II, U+1A60 SAKOT, U+1A43 LA>[3]: Section 14.5 but ᨸᩖᩦ (IPA: [piː]) is encoded as <U+1A38 HIGH PA, U+1A56 MEDIAL LA, U+1A66 SIGN II>.[3]: Section 4 (For the use of LA as a syllable final letter, compare ᩁᨭᩛᨷᩣ᩠ᩃ[3]: Section 4 (Northern Thai pronunciation: [lat tha baːn]).
U+1A57 SIGN LA TANG LAI는 <U+1A60 SAKOT, U+1A43 LA>처럼 보이지만, 본래 <U+1A60 SAKOT, U+1A26 NGA>와 결부되어 있다.타이루는 이것을 이용하여 ᨴᩢ᩵ᩣ(IPA: [ta la laii])[6]이라는 단어를 쓴다.
ᨣᩝᩴ (IPA: [kɔː bɔː])is encoded as <U+1A23 LOW KA, U+1A5D SIGN BA, U+1A74 MAI KANG>, but ᨠᩢ᩠ᨷ (IPA: [kap]) is encoded as <U+1A20 HIGH KA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A37 BA> and ᨠᩢᨷ᩠ᨷ᩺ (IPA: [kap]) is encoded as <U+1A20 HIGH KA, U+1A62 MAI SAT, U+1A37 BA, U+1A60 SAKOT, U+1A37 BA, U+1A7A RA HAAM>
- In the final proposal,[3]: 1 which the Unicode Consortium accepted that what is now SIGN BA (as in ᨣᩝᩴ) would be encoded as <SAKOT, BA> and what is now <SAKOT, BA> (as in ᨠᩢ᩠ᨷ) should be encoded as <SAKOT, HIGH PA>, but during the ISO process the meaning of <SAKOT, BA> changed[5] and SIGN BA was added.그러나 ป을 음절 끝자음으로 하는 태국어 단어에는 <SAKOT, HIGHY PA>의 본래 뜻이 남아 있다.(이 제안은 <SAKOT, HIGH PHA>라고 잘못 부른다.
팔리는 라오스와 태국 북동부에서 BA 대신 HIGH PA를 사용한다.그러므로 팔리에서 <U+1A60 SAKOT, U+1A38 HIGH PA>로 부호화된 <SAKOT, BA>를 찾을 준비를 해야 한다.
타이쿤은 첨자 HIGH SA를 쓰는 두 가지 방법이 있다.그것들은 교환할 수 없다.타이큐엔에서는 ᩃᩮᩞ를 쓰는 것은 옳고 ᩃᩮ᩠를 쓰는 것은 틀리지만,[5] ᩈ᩠ᨶᩥ write를 쓰는 것은 틀리지만, ᩈᩥᨶᨶ!!를 쓰는 것은 틀렸다!ᩃᩮᩞ is encoded as <U+1A43 LA, U+1A6E SIGN E, U+1A5E SIGN SA> while the incorrect ᩃᩮ᩠ᩈ is encoded as <U+1A43 LA, U+1A6E SIGN E, U+1A60 SAKOT, U+1A48 HIGH SA>.
Tai Khuen은 첨자 MA를 작성하는 추가적인 방법이 있다.There is a special codepoint for this additional method[4]: Item 9 The word which Northern Thai writes as ᨵᨾ᩠ᨾ᩺ is written in Tai Khuen both as ᨵᨾ᩠ᨾ᩼ encoded as <U+1A35 LOW THA, U+1A3E MA, U+1A60 SAKOT, U+1A3E MA, U+1A7C KARAN> and as ᨵᨾᩜ᩼ encoded as <U+1A35 LOW THA, U+1A3E MA, U+1A5C SIGN MA, U+1A7C KARAN>.
There are two ways of writing the subscript for both HIGH RATHA and LOW PA. ᨶᩥᨣᨱᩛ[7]: 368 is encoded as <U+1A36 NA, U+1A65 SIGN I, U+1A23 LOW KA, U+1A31 RANA, U+1A5B SIGN HIGH RATHA OR LOW PA>: ᩁᩣᨩᨽᩢ᩠ᨮ[3]: 3 is encoded <U+1A41 RA, U+1A63 SIGN AA, U+1A29 LOW CA, U+1A3D LOW PHA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A2E HIGH RATHA>.ᨶᩥᨻᩛᩣᨶ is encoded as <U+1A36 NA, U+1A65 SIGN I, U+1A3B LOW PA, U+1A5B SIGN HIGH RATHA OR LOW PA, U+1A63 SIGN AA, U+1A36 NA>: ᨴᩮ᩠ᨻ is encoded as <U+1A34 LOW TA, U+1A6E SIGN E, U+1A60 SAKOT, U+1A3B LOW PA>.후자도 ᨴᩮᨷ로 쓴다.The Lao-style consonant conjunct ᨲ᩠ᨳ (encoded as <U+1A32 HIGH TA, U+1A60 SAKOT, U+1A33 HIGH THA>) looks as though it is ᨲᩛ encoded as <U+1A32 HIGH TA, U+1A5B SIGN HIGH RATHA OR LOW PA>.U+1A5B의 모양은 첨자가 되는 자음에 따라 달라진다.
The dependent vowel of words like ᨯᩬᨠ 'flower' is encoded by the special vowel <U+1A6C SIGN OA BELOW>; one should not use the sequence <U+1A60 SAKOT, U+1A4B LETTER A> There is also an encoded dependent vowel for words like Tai Khuen, Tai Lue and Lao words such as ᨶ᩶ᩭ, namely U+1A6D SIGN OY.이 모음은 <U+1A6C SIGN OA BEASH, U+1A60 SAKOT, U+1A3F LOW YA>로 인코딩되지 않는다(이것은 북태국이 해당 단어에 사용하는 말이며, 순서 <U+1A60 SAKOT, U+1A40 High YA)[3]도 아니다.
위첨자 자음
위첨자 자음은 기본 자음과 독립적으로 암호화된다.일부 문자는 위첨자 자음과 다른 역할 모두에서 사용되므로 이 절에서 자세히 설명된다.
니기가히타(Niggahita)로 U+1A74 MAI KANG으로 암호화되어 있다.위첨자 WA는 별도로 인코딩되지 않는다.MAI KANG으로 부호화 되어 있다.예를 들어 타이쿠엔 ᨯ᩠ᩴ(IPA: [deu])은 <U+1A2, DA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A74 MAI KANG>로 인코딩된다.문자 시퀀싱의 목적상 일반적으로 모음으로 취급된다.
위첨자 클러스터 초기 NGA는 U+1A58 MAI KANG LAI로 인코딩된다.라오자는 일반적으로 MAI KANG LAI와 U+1A59 SIGN FINAL NGA에 동일한 글리프를 사용한다.
U+1A62 MAI SAT는 모음, 최종 자음, 모음 단축의 세 가지 역할을 한다.
RA와 모음 킬러의 위첨자 형태의 인코딩을 선택하는 것은 어려웠다.1940년대에 타이쿤은 자음과 모음 킬러를 같은 방법으로 썼다.인코딩 제안자들은 문의를 했고 글립자가 여전히 같다는 말을 듣고 U+1A7A RA HAAM으로 인코딩했다.그 후 타이큐엔이 모음 킬러의 글리프를 변화시켰다는 것을 알게 되었고, 새로운 문자 U+1A7C 카란이 모음 킬러의 타이큐엔 스타일에 추가되었다.일부 북방 태국 작가들은 모음 킬러로 U+1A7C를 사용하는 것을 선호하고 있으며, 실제로 그 글립의 사용은 북방 태국어 필체로 알려져 있지 않다.
스페셜 자음
특수 양식 ᩓ과 ᩕ은 각각 코드 포인트 U+1A53과 U+1A55로 인코딩된다.
U+1A36 NA와 U+1A63 SIGN AA의 글립자가 나란히 있을 경우 그것들은 두 개의 분리된 글립자가 아니라 끈으로 쓰여진다.NA에 첨자음이나 비팔로우 마크가 붙어 있어도 끈으로 쓴다.Examples: ᨾᨶ᩠ᨲᩣ (IPA: [man taː], encoding <U+1A3E MA, U+1A36 NA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A63 SIGN AA>) and ᨶᩮᩢᩣ (IPA: [nau], encoding <U+1A36 NA, 1A6E SIGN E, U+1A62 MAI SAT, U+1A63 SIGN AA>).첨자 NA와 SIGN AA는 유사하게 리깃(예: ᩉ᩠ᨶᩣ)(IPA: [naː]), 인코딩된 <U+1A49 HIGH HA, U+1A60 SAKOT, 1A36 NA, U+1A63 SIGN AA>)이 아니다.
느낌의 단어이기 때문에 ᩅᩥᩈᩮ᩠ᩈ(북부 태국 발음:[wiseːt], 인코딩<>U+1A45 WA, U+1A65 더하기 기호, U+1A48 높은 SA는 U+1A6E 더하기 기호 E, U+1A60 SAKOT, U+1A48지 고출력 SA>.)지만 한번은 <으로 마지막 음절을 폐쇄할 수 있는 모습은 아주 ᩅᩥᩔᩮ에서 다른 가진 이중 자음의 자음 ᩔ 별도로, 박혀 있다.높은 SA는 SAKOT, 높은 SA는 더하기 기호 E>을 말한다.실제로, 2019년부터 2020년까지 후자를 표준 철자로 정립하려는 캠페인이 있었다.
By contrast, the geminate consonant ᨬ᩠ᨬ is encoded as the conjunct <U+1A2C NYA, U+1A60 SAKOT, U+1A2C NYA>, even though some of its glyphs may resemble the hypothetical conjunct ᨱ᩠ᨬ <U+1A31 RANA, U+1A60 SAKOT, U+1A2C NYA>.
독립 모음
독립모음 ᩋ과 자음 ᩋ은 같은 문자인 U+1A4B이다.
독립모음 ᩋᩣ과 자음 ᩋ과 종속모음 ᩣ의 순서는 모양 appearanceᩣ이 같으며 따라서 모두 인코딩된 <U+1A20 문자 A, U+1A63 SIGN AA>이다.
북타이어는 자체 코드 포인트가 있는 5개의 독립 모음, 즉 ᩍ, ᩎ, ᩐ,[3]: Section 3 ᩑ을 사용한다.
북태국에서 8번째 독립모음은 자음 ᩋ과 종속모음 ᩰ의 순서, 즉 ᩋᩰ과 다르지 않으며, 따라서 둘 다 인코딩된 <U+1A4B LEATER A, U+1A70 SIGN OO>이다.다른 언어들은 독립모음에는 구별되는 문자 ᩒ U+1A52 LEATER OO를 사용한다.
텍스트 내의 문자 순서
인코딩 제안서는[3] 유니코드 문자의 순서를 정의했다.
버마어, 크메르어어, 인도어 등을 쓰는 방식처럼 유니코드 문자는 특별한 경우를[9] 제외하고는 소리의 순서에 따라 순서가 정해지고, 2개의 소리가 하나의 소리로 결합한 다음 구순을 사용한다.이 주문은 보통 샴에서와 같다.소리가 순서가 없으면 시각 순서 또는 특별한 대체 순서를 사용한다.
다음과 같은 특수 규칙이 있다.
- (a) 모음순서
- (b) 모든 변종에서 마이 기아(ma
- (c) 모든 변형에서 마이 쿠아(mai kua)를 쓰는 것
- (d) mai cam의 글씨는
- (e) 톤 마크의 작성
자음과 모음을 위한 유니코드 문자의 순서는 시작 문자, 참 모음 표시, 코다 자음, 시작 문자, 참 모음 표시, 코다 자음이다.[3]: Section 14 편의상 모음을 죽이는 상징은 모음이라고 생각한다.
'온셋 문자'는 자음, 독립 모음 또는 특수 기호들이다.그룹 내 자음은 울리거나 울릴 때 사용하는 순서에 따라 순서가 정해진다.
예: ᨻᩩ᩠ᨵ(북태어 발음: [put thaʔ])
- 시작 문자: ᨻ
- 순모음: ᩩ
- 최종 'consonant': ᨴ
- 시작 문자: ᨵ
- 순수 모음: 기호 없음
- 최종 자음: 없음
인코딩은 <U+1A3B LOW PA, U+1A69 SIGN U, U+1A34 LOW TA, U+1A60 SAKOT, U+1A35 LOW THA>이다.
예: ᨻᩕ은 북태어 발음의 단음음([pʰ])을 가지고 있으나, 이전에는 중앙태어처럼 ᨻ과 그 다음에 ᩁ의 두 가지 소리를 가지고 있었다.이 단어는 <LOW PA, MEDIAL RA>로 부호화되어 있다.
MEDIAL RA와는 별도로 자음글립의 순서는 소리의 순서와 같다.대부분의 경우 MEDIAL RA는 마지막 자음이지만 /ua/의 WA와 /ia/의 LOW YA는 MEDIAL RA를 따른다.
예:
- ᩆᩣᩈ᩠ᨲᩕ᩺ is encoded <U+1A46 HIGH SHA, U+1A63 SIGN AA, U+1A48 HIGH SA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A55 MEDIAL RA, U+1A7A RA HAAM>.
- ᨠᩕᩢᨲ은 인코딩된 <U+1A20 HIGH KA, U+1A55 MEDIAL RA, U+1A48 HIGH SA, U+1A62 MAI SAT, U+1A60 SAKOT, U+1A32 HIGTTA>
- ᩈᩕ᩠ᨾ은 암호화된 <U+1A48 HIGH SA, U+1A55 MEDIAL RA, U+1A60 SAKOT, U+1A45 WA, U+1A3E MA>이다.
- But ᨲᩕ᩠ᨶᩬᨾ (Northern Thai pronunciation: [tʰa nɔːm])[7]: 269 is encoded <U+1A32 HIGH TA, U+1A55 MEDIAL RA, U+1A60 SAKOT, U+1A36 NA, U+1A6C SIGN OA BELOW, U+1A3E MA>
ᨧᩮᩢᩣ과 같은 단어의 경우 모음과 음조의 기호가 다음과 같은 순서를 갖는 규칙이 있다.[3]: Section 5 first part, 5.3 and 13
- (1) 선행 모음
- (2) 아래의 모음(위아래)
- (3) 위(아래에서 위로) 모음
- (4) 톤 표시(좌우)
- (5) 후행 모음(좌우)
이러한 규칙의 적용에서 MAI KANG은 niggahita 또는 자음으로서 기능함에도 불구하고 모음으로 간주된다.유니코드 문자 MAI SAT는 자음, 즉 마이카크(Mai Kak)로서 기능한다 하더라도 모음으로 간주된다. 즉, as as᩠ᨯ에서와 같이 최종 자음이나 모음 단축제로서 기능한다.
The relative ordering of the marks above and below should follow Thai and Lao as in เจ้า เกี่ว ชุํ and ບິ່.
예:
- ᨧᩮᩢᩣ는 <U+1A27 HIGH CA, U+1A6E SIGN E, U+1A62 MAI SAT, U+1A76 TONE-2, U+1A63 SIGN AA>[3]: Section 5 no. 29 로 암호화되어 있다.
- ᨾᩢᩣ(IPA: [maːk])는 <U+1A3E MA, U+1A62 MAI SAT, U+1A63 SIGN AA>로 인코딩된다.
- ᩃᩪᩢ(IPA: [luːk])는 <U+1A43 LA, U+1A6A SIGN UU, U+1A62 MAI SAT>로 인코딩된다.
- ᨶᩮᩣ는 <U+1A36 NA, U+1A6E SIGN E, U+1A62 MAI SAT, U+1A63 SIGN AA>로 인코딩되어 있다.
- ᩋᩫᨶ᩠ᨲᩕᩣ᩠ᨿ (Northern Thai pronunciation: [on thaʔ laːi]) is encoded as <U+1A4B LETTER A, U+1A6B SIGN O, U+1A36 NA, U+1A60 SAKOT, U+1A32 HIGH TA, U+1A55 MEDIAL RA, U+1A63 SIGN AA, U+1A60 SAKOT, U+1A3F LOW YA>
/ia/ 및 /ua/의 모든 형태에서, 첨자 LOW YA와 WA는 시작 자음으로 간주된다.[3]: Section 14.3
예:
- ᩈ᩠ᩮᩮ은 실제로 인코딩된 <U+1A48 HIGH SA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A6E SIGN E>[3]: Section 5 No. 33 이다.
- ᨸ᩠ᩃᨿᩁ은 실제로 인코딩된 <U+1A38 HIGH PA, U+1A60 SAKOT, U+1A43 LA, U+1A60 SAKOT, U+1A3F LOW YA, U+1A75 TON-1, U+1A41 RA>[3]: Section 14.9 이다.
- ᨲ᩠ᩫᩫ은 실제로 인코딩된 <U+1A32 HIGH TA, U+1A60 SAKOT, U+1A45 WA, U+1A6B SIGN O>[3]: Section 14.3 이다.
- ᩈ᩠ᩅᩁ은 실제로 인코딩된 <U+1A48 HIGH SA, U+1A60 SAKOT, U+1A45 WA, U+1A75 TONE-1, U+1A41 RA>이다.
- ᨠ+1A20 KA, U+1A56 MEDIAL LA, U+1A60 SAKOT, U+1A45 WA, U+1A60 SAKOT, U+1A76 TON-2, U+1A3F Low YA로 인코딩되어 있다.
- (<U+1A60, U+1A76>은 정식적으로 <U+1A76, U+1A60>과 동일하다.)
태국 북부 이외의 지역에서는 /am/의 기호에 MAI GANG이 SIGN AA 구성요소에 기록되어 있다.태국 북부에서는, 그것은 자음, SIGN AA 그리고 그들 사이에 다양하게 배치되어 있다.유니코드 컨소시엄은 이 조합을 위한 특별한 캐릭터를 거절했다.ᨷᩴ᩵ᩣ(북태어 발음: [bɔmaː])은 ᨲ᩵ᩣᩴ(IPA: [tam])과 같은 모음으로 나타나서는 안 된다.따라서 /am/의 조합은 <U+1A63 SIGN AA, U+1A74 MAI KANG>로 인코딩된다.ᨷᩴ᩠ᩣ word이라는 단어는 <U+1A37 BA, U+1A74 MAI KANG, U+1A75 TONE-1, U+1A60 SAKOT, U+1A3E MA, U+1A63 SIGN AA>로 암호화되어 있다.ᨲ᩵ᩴ라는 단어는 <U+1A32 HIGH TA, U+1A75 TONE-1, U+1A63 SIGN AA, U+1A74 MAI KANG>로 부호화되어 있다./am/와 SIGN TARK AA의 조합은 <U+1A64 SIGN TARK AA, U+1A74 MAI KANG>로 인코딩된다.
U+1A5A SIGN LOW PA는 특수한 경우로, 타이루어 단어 ᨣᨽᩚᩚ(IPA: [갑파ʔ])는 <U+1A23 LOW KA, U+1A3D LOW PHA, U+1A5A SIGN LOW PA>로 인코딩되어 있다.[3]: Section 4
mai 캉라이와 la tang lai를 보여주는 예:
- Pali 단어 ᩘᩮᩣ ((saṅho)는 암호화된 <U+1A48 SA, U+1A58 MAI KANG RAI, U+1A25 LOW KHA, U+1A6E SIGN E, U+1A63 SIGN AA>이다.
- Northern Thai word ᨴᩘ᩠ᩃᩣ᩠ᨿ (Northern Thai pronunciation: [taŋ laːi]) is encoded <U+1A34 LOW TA, U+1A58 MAI KANG LAI, U+1A60 SAKOT, U+1A43 LA, U+1A63 SIGN AA, U+1A60 SAKOT, U+1A3F LOW YA>.
- 타이루어 단어 ᨴᩢᩣ(타이루어 발음: [taŋ laːi])는 암호화된 <U+1A34 LOW TAA, U+1A62 MAI SAT, U+1A57 LA TANG RAI, U+1A63 SIGN AA>이다.
외부 링크
- 츄, P, 생분, P, & 자구함, R. (2015)"Tai Tham: 현재 인코딩 모델에 도전하는 하이브리드 스크립트".국제화 유니코드 컨퍼런스(IUC 39)에서 발표.
참조
- ^ "Unicode character database". The Unicode Standard. Retrieved 2016-07-09.
- ^ "Enumerated Versions of The Unicode Standard". The Unicode Standard. Retrieved 2016-07-09.
- ^ a b c d e f g h i j k l m n o p q r s t Everson, Michael; Hosken, Martin; Constable, Peter (21 March 2007). "Revised proposal for encoding the Lanna script in the BMP of the UCS" (PDF). Unicode.
- ^ a b "Tai Tham Ad-hoc Meeting Report (WG2 N3379)" (PDF). Unicode. 22 January 2008.
- ^ a b c Hosken, Martin (28 January 2008). "Tai Tham Subjoined Variants" (PDF). Unicode.
- ^ Khotsimeuang, Veomany. "Tai Lue: Complex Orthographic Rules: Graphic Blends(I)". SEAsite. Retrieved 10 June 2018.
- ^ a b Rungruengsi, Udom (January 2004). Lanna-Thai Dictionary: Maefahluang Edition พจนานุกรมล้านนา ~ ไทย: ฉบับแม่ฟ้าหลวง (in Thai). Chiang Mai: Chiang Mai University. ISBN 974-685-175-6.
- ^ COENG로 읽으십시오.U+17D2 KMER SIGN COENG
- ^ "라나의 인코딩 모델은 미얀마와 크메르의 인코딩 모델과 유사하며, CEONG과[8] 같은 캐릭터와 일부의 결합형 캐릭터가 사용된다."[3]: Section 14