유니코드의 라틴어 스크립트

Latin script in Unicode

라틴어 스크립트에서 1,000자 이상의 문자가 유니코드 표준으로 인코딩되며, 몇 개의 기본 및 확장된 라틴 블록으로 그룹화된다. 확장 범위에는 주로 사전 컴파일된 문자와 이아크리틱스 결합으로 동등하게 인코딩되는 분음 부호화가 포함되며, 예를 들어 다양한 아프리카 언어(라틴 확장-B의 클릭 기호 포함)와 베트남 문자(라틴 확장 추가)의 맞춤법에서 사용된다. 라틴어 익스텐드-C에는 위구르어 문자와 클라우디안 문자에 대한 추가 사항이 포함되어 있다. 라틴어 Extended-D는 중세주의자들이 주로 관심을 갖는 캐릭터들로 구성된다. 라틴어 Extended-E는 대부분 독일어 변증법(Teuthonista)에 사용되는 문자로 구성된다.[1] 라틴어 확장-F에는 음성 표기를 위한 문자가 포함되어 있다.

블록

유니코드 표준 버전 14.0을 기준으로 다음 블록에서 1,475자가 라틴어 스크립트에 속하는 것으로 분류된다.[2]

또한, 통화 기호, 제어 그림, CJK 호환성, 동봉된 영숫자, 동봉된 CJK 문자 및 월, 수학 영숫자 기호, 동봉된 영숫자 보충 블록에 여러 개의 라틴어 같은 문자가 인코딩되지만, 그래픽적으로는 라틴 문자임에도 스크립트 속성이 공통적으로 존재하므로, 그 속성이 일반적이다. 유니코드 용어의 라틴어 스크립트에 속하지 않는다. 리수는 또한 거의 전적으로 라틴어 형태로 구성되지만 고유의 스크립트 속성을 사용한다.

문자표

이 표에서 라틴어의 유니코드 스크립트 속성이 있는 문자들은 그들이 소개된 유니코드 버전을 나타내는 색상으로 강조되어 있다. 예약된 코드 포인트(향후 날짜에 문자로 지정할 수 있음)는 회색 배경이다. 라틴어 스크립트에 속하지 않는 모든 문자는 흰색 배경을 가지고 있다(따라서 그것들이 소개된 유니코드 버전은 표시되지 않는다).

U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F 블록 #
0040 @ A B C D E F G H I J K L M N O C0 제어 및 기본 라틴어
0000–007f
(ASCII와 동일)
52
0050 P Q R S T U V W X Y Z [ \ ] ^ _
0060 ` a b c d e f g h i j k l m n o
0070 p q r s t u v w x y z { } ~ DEL
00A0 ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ ® ¯ C1 제어 및 라틴-1 보충판
0080-00FF
(ISO/IEC 8859-1과 동일)
64
00B0 ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
00C0 À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
00D0 Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
00E0 à á â ã ä å æ ç è é ê ë ì í î ï
00F0 ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ
0100 Ā ā Ă ă Ą ą Ć ć Ĉ ĉ Ċ ċ Č č Ď ď 라틴어 확장-A
0100-017F
128
0110 Đ đ Ē ē Ĕ ĕ Ė ė Ę ę Ě ě Ĝ ĝ Ğ ğ
0120 Ġ ġ Ģ ģ Ĥ ĥ Ħ ħ Ĩ ĩ Ī ī Ĭ ĭ Į į
0130 i ı IJ ij Ĵ ĵ Ķ ķ ĸ Ĺ ĺ Ļ ļ Ľ ľ Ŀ
0140 ŀ Ł ł Ń ń Ņ ņ Ň ň ʼn Ŋ ŋ Ō ō Ŏ ŏ
0150 Ő ő Œ œ Ŕ ŕ Ŗ ŗ Ř ř Ś ś Ŝ ŝ Ş ş
0160 Š š Ţ ţ Ť ť Ŧ ŧ Ũ ũ Ū ū Ŭ ŭ Ů ů
0170 Ű ű Ų ų Ŵ ŵ Ŷ ŷ Ÿ Ź ź Ż ż Ž ž ſ
0180 ƀ Ɓ Ƃ ƃ Ƅ ƅ Ɔ Ƈ ƈ Ɖ Ɗ Ƌ ƌ ƍ Ǝ Ə 라틴어 확장-B
0180-024F
208
0190 Ɛ Ƒ ƒ Ɠ Ɣ ƕ Ɩ Ɨ Ƙ ƙ ƚ ƛ Ɯ Ɲ ƞ Ɵ
01A0 Ơ ơ Ƣ ƣ Ƥ ƥ Ʀ Ƨ ƨ Ʃ ƪ ƫ Ƭ ƭ Ʈ Ư
01B0 ư Ʊ Ʋ Ƴ ƴ Ƶ ƶ Ʒ Ƹ ƹ ƺ ƻ Ƽ ƽ ƾ ƿ
01C0 ǀ ǁ ǂ ǃ DŽ Dž dž LJ Lj lj NJ Nj nj Ǎ ǎ Ǐ
01D0 ǐ Ǒ ǒ Ǔ ǔ Ǖ ǖ Ǘ ǘ Ǚ ǚ Ǜ ǜ ǝ Ǟ ǟ
01E0 Ǡ ǡ Ǣ ǣ Ǥ ǥ Ǧ ǧ Ǩ ǩ Ǫ ǫ Ǭ ǭ Ǯ ǯ
01F ǰ DZ Dz dz Ǵ ǵ Ƕ Ƿ Ǹ ǹ Ǻ ǻ Ǽ ǽ Ǿ ǿ
0200 Ȁ ȁ Ȃ ȃ Ȅ ȅ Ȇ ȇ Ȉ ȉ Ȋ ȋ Ȍ ȍ Ȏ ȏ
0210 Ȑ ȑ Ȓ ȓ Ȕ ȕ Ȗ ȗ Ș ș Ț ț Ȝ ȝ Ȟ ȟ
0220 Ƞ ȡ Ȣ ȣ Ȥ ȥ Ȧ ȧ Ȩ ȩ Ȫ ȫ Ȭ ȭ Ȯ ȯ
0230 Ȱ ȱ Ȳ ȳ ȴ ȵ ȶ ȷ ȸ ȹ Ⱥ Ȼ ȼ Ƚ Ⱦ ȿ
0240 ɀ Ɂ ɂ Ƀ Ʉ Ʌ Ɇ ɇ Ɉ ɉ Ɋ ɋ Ɍ ɍ Ɏ ɏ
0250 ɐ ɑ ɒ ɓ ɔ ɕ ɖ ɗ ɘ ə ɚ ɛ ɜ ɝ ɞ ɟ IPA 확장
0250–02AF
96
0260 ɠ ɡ ɢ ɣ ɤ ɥ ɦ ɧ ɨ ɩ ɪ ɫ ɬ ɭ ɮ ɯ
0270 ɰ ɱ ɲ ɳ ɴ ɵ ɶ ɷ ɸ ɹ ɺ ɻ ɼ ɽ ɾ ɿ
0280 ʀ ʁ ʂ ʃ ʄ ʅ ʆ ʇ ʈ ʉ ʊ ʋ ʌ ʍ ʎ ʏ
0290 ʐ ʑ ʒ ʓ ʔ ʕ ʖ ʗ ʘ ʙ ʚ ʛ ʜ ʝ ʞ ʟ
02A0 ʠ ʡ ʢ ʣ ʤ ʥ ʦ ʧ ʨ ʩ ʪ ʫ ʬ ʭ ʮ ʯ
02B0 ʰ ʱ ʲ ʳ ʴ ʵ ʶ ʷ ʸ ʹ ʺ ʻ ʼ ʽ ʾ ʿ 간격 한정자 문자
02B0-02FF
14
02E0 ˠ ˡ ˢ ˣ ˤ ˥ ˦ ˧ ˨ ˩ ˪ ˫ ˬ ˭ ˮ ˯
1D00 음성 확장기
1D00–1D7F
111
1D10
1D20
1D30 ᴿ
1D40
1D50
1D60
1D70 ᵿ
1D80 음성확장보충제
1D80–1DBF
63
1D90
1DA0
1DB0 ᶿ
1E00 Latin Extended Additional
1E00–1EFF
256
1E10
1E20
1E30 ḿ
1E40
1E50
1E60
1E70 ṿ
1E80
1E90
1EA0
1EB0 ế
1EC0
1ED0
1EE0
1EF0 ỿ
2070 Superscripts and Subscripts
2070–209F
15
2090
2120 Ω Letterlike symbols
2100–214F
4
2130
2140
2160 Number Forms
2150–218F
41
2170
2180
2C60 Latin Extended-C
2C60–2C7F
32
2C70 Ɀ
A720 Latin Extended-D
A720–A7FF
188
A730
A740
A750
A760
A770
A780
A790
A7A0
A7B0
A7C0
A7D0
A7E0
A7F0
AB30 ꬿ Latin Extended-E
AB30–AB6F
56
AB40
AB50
AB60
FB00 Alphabetic Presentation Forms FB00–FB4F 7
FF20 Halfwidth and Fullwidth Forms
(fullwidth Latin letters)
FF00–FFEF
52
FF30 _
FF40
FF50
10780 𐞀 𐞁 𐞂 𐞃 𐞄 𐞅 𐞇 𐞈 𐞉 𐞊 𐞋 𐞌 𐞍 𐞎 𐞏 Latin Extended-F
10780–107BF
57
10790 𐞐 𐞑 𐞒 𐞓 𐞔 𐞕 𐞖 𐞗 𐞘 𐞙 𐞚 𐞛 𐞜 𐞝 𐞞 𐞟
107A0 𐞠 𐞡 𐞢 𐞣 𐞤 𐞥 𐞦 𐞧 𐞨 𐞩 𐞪 𐞫 𐞬 𐞭 𐞮 𐞯
107B0 𐞰 𐞲 𐞳 𐞴 𐞵 𐞶 𐞷 𐞸 𐞹 𐞺
1DF00 𝼀 𝼁 𝼂 𝼃 𝼄 𝼅 𝼆 𝼇 𝼈 𝼉 𝼊 𝼋 𝼌 𝼍 𝼎 𝼏 Latin Extended-G
1DF00–1DFFF
31
1DF10 𝼐 𝼑 𝼒 𝼓 𝼔 𝼕 𝼖 𝼗 𝼘 𝼙 𝼚 𝼛 𝼜 𝼝 𝼞
Total characters 1,475

See also

References

  1. ^ Everson, Michael; Dicklberger, Alois; Pentzlin, Karl; Wandl-Vogt, Eveline (2011-06-02). "Revised proposal to encode "Teuthonista" phonetic characters in the UCS" (PDF).
  2. ^ "Scripts-14.0.0.txt". Unicode Consortium. 2021-07-10. Retrieved 2021-09-15.