유니코드 입력

Unicode input
유니코드 수학 연산자의 하위 집합을 표시하는 KCharSelect 문자 매핑 도구
유니코드 로고

유니코드 입력사용자가 컴퓨터에 특정 유니코드 문자를 삽입하는 것으로 물리적 키보드가 직접 지원하지 않는 문자를 입력하는 일반적인 방법이다.유니코드 문자는 디스플레이에서 선택하거나 물리적 키보드에 특정 시퀀스의 키를 입력하여 만들 수 있다.또한, 한 웹 페이지나 문서에서 이러한 방법 중 하나에 의해 생산된 문자를 다른 웹 페이지나 문서에 복사할 수 있다.ASCII의 96개 요소 문자 집합(포함)과는 대조적으로 유니코드는 세계의 거의 모든 문자 언어에서 수십만 개의 그래프(차자)를 암호화하고 그 외 많은 부호와 기호를 부호화한다.[1][better source needed]

유니코드 입력 시스템은 이상적으로는 모든 유효한 유니코드 코드 포인트인 큰 레퍼토리를 제공해야 한다.이는 특정 로케일에 적합한 제한된 수의 문자에 대해서만 키와 키 조합을 정의하는 키보드 레이아웃과는 다르다.

유니코드 번호

유니코드 문자는 코드 포인트로 구분되는데, 코드 포인트는 일반적으로 "U+"에 이어 4자리, 5자리 또는 6자리 숫자(예: U+00AE 또는 U+1D310)로 표시된다.기본 다국어 평면(BMP)의 문자는 – 많은 한자와 일본어 문자를 포함한 – 그리고 많은 기호를 포함하는 – 4자리 코드를 가지고 있다.역사적 대본은 물론 현대적인 기호와 픽토그래프(이모티콘, 이모티콘, 플레이 카드, 많은 CJK 문자 등)도 5자리 코드로 되어 있다.

유용성

어플리케이션은 문자의 글리프를 포함하는 글꼴에 접근할 수 있는 경우에만 문자를 표시할 수 있다.[2]유니코드 적용범위를 모두 갖춘 글꼴은 극소수에 불과하며, 대부분의 글꼴은 몇 개의 쓰기 시스템을 지원하는 데 필요한 글리프만 포함하고 있다.그러나 대부분의 현대 브라우저와 기타 텍스트 처리 애플리케이션은 글꼴 대체를 수행하므로 다국어 콘텐츠를 표시할 수 있으며, 현재 글꼴에서 지원되지 않는 문자를 표시하기 위해 필요할 때 자동으로 예비 글꼴로 전환된다.어떤 글꼴이 폴백에 사용되고 유니코드 커버리지의 철저성은 소프트웨어와 운영 체제에 따라 달라진다. 어떤 소프트웨어는 설치된 모든 글꼴에서 적절한 글리프를 검색하며, 다른 글꼴은 특정 글꼴 내에서만 검색한다.

만약 어플리케이션이 글리프에 접근할 수 없다면, 문자는 보통 글꼴의 ".notdef" 글리프 ⟨􏿮⟩[3]로 표시되며, 이 글자는 빈 상자(형상에 따라 "tof"라고 닉네임), X가 들어 있는 상자 또는 물음표가 들어 있는 상자로 자주 나타난다.현대의 구현에서는 지원되지 않는 문자에 대해 .notdef를 사용하고, 인코딩 오류에 대해서만 대체 문자 ⟨�을 사용한다.

화면에서 선택

GNOME 문자표

많은 시스템이 유니코드 문자를 시각적으로 선택할 수 있는 방법을 제공한다.ISO/IEC 14755는 이를 스크린 선택 입력 방식이라고 한다.[4]

Microsoft Windows는 XP 이후 소비자 버전에 나타나는 문자표 프로그램의 유니코드 버전을 제공하고 있다.이것은 기본 다국어 평면(BMP)의 문자로 제한된다.문자는 유니코드 문자 이름으로 검색 가능하며, 표는 특정 코드 블록으로 제한될 수 있다.[5]같은 유형의 보다 고급 제3자 도구도 이용할 수 있다(유니코드 문자를 모두 지원하는 BabelMap이 주목할 만한 프리웨어 예).대부분의 Linux 데스크톱 환경에서는 GNOME(gucharmap) 또는 KDE(kcharselect)와 같은 동등한 도구를 사용할 수 있다.[6][failed verification]

일반적으로 이러한 도구는 사용자가 직접 입력하는 척하지 않고 선택한 문자를 클립보드에 "복사"한 다음 문서에 붙여넣을 수 있게 한다.

웹이나 다른 문서에서 원하는 문자를 찾아서 복사해서 붙여넣는 것이 실용적일 때가 많다.

십진입력

워드워드패드의 최근 버전을 포함하여 마이크로소프트 윈도우즈에서 실행 중인 일부 프로그램에서는 유니코드 코드 포인트에서 10진수로 표현되고 숫자 키패드에 입력된 문자를 다음과 같이 생성할 수 있다. Alt 키를 누르다예를 들어 유로시그뉴 20AC를 십진수 8364인 16진수 코드 포인트로 가지고 있으므로 8364+는 기호를 생성한다.마찬가지로 +120132이중 박자 𝕄을 생성한다.

160~255 범위의 10진수 코드 포인트는 선행 0(Windows 코드 페이지를 선택하도록)으로 입력해야 하며, 나아가서는 Windows 코드 페이지가 유니코드와 일치하도록 설정해야 한다(CP1252를 사용해야[a] 함).예를 들어 0247+는 코드 포인트에 해당하는 ÷을 산출하지만 247+가 산출하는 문자는 코드 페이지 437과 같은 OEM 코드 페이지에 따라 달라지며 을 산출할 수 있다.

255를 초과하는 Alt 코드가 작동하지 않는 프로그램에서 검색된 문자는 일반적으로 숫자를 256으로 나눈 나머지 문자에 해당한다.

텍스트 편집기 Vim은 2개의 문자로 된 니모닉(Vim developers에 의해 "digraphs"라고 불림)으로 문자를 지정할 수 있다.설치된 세트는 임의 코드 포인트에 대해 정의된 사용자 정의 니모닉에 의해 십진수로 지정될 수 있다.예를 들어, 10진수 9881은 16진수 2699와 같으므로,dig Gr 9881 "Gr"를 U+2699 GER와 연결한다.

HTML에서 십진수 코드 포인트를 사용하려면 아래를 참조하십시오.

16진수 입력

ISO/IEC 14755의 5.1절은 시작 시퀀스에 따라 코드 포인트와 끝 시퀀스의 16진수 표현을 따르는 기본 방법을 설명한다.대부분의 현대 시스템은 이것을 모방하는 몇 가지 방법을 가지고 있는데, 때로는 네 자리(기본 다국어 평면만 해당)로 제한되기도 한다.

Microsoft Windows의 경우

16진수 유니코드 입력은 호출된 문자열 유형(REG_SZ) 값을 추가하여 활성화할 수 있다.EnableHexNumpad레지스트리 키로HKEY_CURRENT_USER\Control Panel\Input Method그리고 가치 데이터 할당1작업을 시작하려면 레지스트리를 편집한 후 로그오프했다가 다시 로그인해야 한다. (Vista 이전 버전에서는 작업을 시작하려면 재부팅이 필요했다.)

그런 다음 유니코드 문자를 누르고 숫자 키패드를 입력한 다음, 숫자 키패드를 사용하여 0에서 9까지의 숫자와 A에서 F까지의 문자 키를 사용하여 16진수 코드를 입력한 다음 를 해제하면 된다.[2]이것은 다음과 같은 5자리 16진수 코드에는 작동하지 않을 수 있다.U+1F937.

UnicodeInput 창

레지스트리를 편집하지 않거나 많은 랩톱에서처럼 숫자 키패드를 사용할 수 없는 경우 유니코드와 같은 타사 소프트웨어입력을 사용할 수 있다.[7]

AutoHotkey 스크립트는 키 입력을 위한 유니코드 문자 대체를 지원한다.예를 들어 명령어Send {U+2014}활성 창의 텍스트 필드에 전자 대시를 삽입한다.[8]

일부 응용 프로그램(Word, WordPadLibreOffice 프로그램)에서는 보다 간단한 방법이 지원된다. 먼저 문자의 코드 포인트(2~6자리의 16진수 사이)를 입력한 다음 유니코드 문자로 숫자를 대체할 +X를 입력한다.예를 들어, 입력f1그리고 그 조합을 누르면 'nn'이라는 캐릭터가 생성될 겁니다.

6자리 16진수의 길이가 아닌 한, 코드 앞에 숫자 또는 a-f가 있으면 안 된다. 숫자 또는 문자는 변환할 코드의 일부로 취급될 수 있기 때문이다.예를 들어, 입력af1+X 뒤에 ' +'(U+0AF1)이 생성되지만 입력a0000f1+X 뒤에 'an'이 표시되고 U+00F1 문자가 표시된다.

Word(예: Word)에서 이 기법으로 원하는 문자를 생성한 다음 복사하여 이 방법을 직접 지원하지 않는 응용 프로그램에 붙여넣을 수 있다.

MacOS에서

유니코드의 16진수 입력을 활성화해야 한다.Mac OS 8.5 이상에서는 유니코드 헥스 입력 키보드 레이아웃을 선택할 수 있고, OS X(10.10) 요세미티에서는 키보드 → 입력 소스에 추가할 수 있다.

누르고 있으면 4자리 16진수 유니코드 코드 포인트와 동등한 문자가 나타난다. 그런 다음 키를 놓을 수 있다.[9]BMP(기본 다국어 평면) 외부의 문자는 유니코드 16진 입력 메커니즘의 네 자리 제한을 초과하지만 대리모 쌍을 사용하여 입력할 수 있다: 첫 번째 대리모, , 두 번째 대리모를 입력할 때 키를 누른 다음 옵션 키를 해제한다.

X11(Chrome OS를 포함한 Linux 및 기타 Unix 모델)

많은 애플리케이션에서 다음 방법 중 하나 또는 둘 다 유니코드 문자를 직접 입력하는 데 효과가 있다.

  • +⇧ Shift를 누르고 입력한 다음 16진수를 입력한 다음 +를 해제하십시오.⇧ Shift
  • ++⇧ Shiftu 입력, 해제, 해제, 16진수 입력, 일부 시스템에서는 (또는 짝수, 눌렀다 놓기 또는 )[10]

이는 GTK 및 Qt 애플리케이션과 다른 애플리케이션에서 지원된다.크롬 OS에서는 운영체제 기능이다.[10]

플랫폼에 독립적인 애플리케이션

  • Emacs에서 x8↵ Enter+ 또는 x+insert-char.
  • LibreOffice 5.1 이후 버전에서는 Windows에 대해 위에서 설명한 +X 방법이 작동한다.
  • Presto 레이아웃 엔진(예: 버전 12.xx 포함)을 사용하는 Opera 버전에서는 원하는 기호나 문자의 16진수 숫자를 입력한 다음 ++(⇧ Shiftx대안 바로 가기 ⇧ Shiftx+ macOS)를 누르십시오.
  • Vim 편집기의 삽입 모드에서는 사용자가 +(V최대 4개의 16진수를 사용할 경우,VU +를 길게 사용할 경우)를 먼저 입력한 다음 원하는 기호나 문자의 16진수를 입력하면 기호로 변환된다.(Microsoft Windows에서는 + 대신 +Q가 필요할 수 있다.)V[11]
  • AutoC에서AD \U2300또는 세 개의 바로 가기%%c,%%d,%%p.

HTML

HTMLXML에서 문자로 렌더링할 문자 코드는 앰퍼샌드숫자 기호(&#)로 앞에 붙고 세미콜론(;)이 뒤따른다.코드 포인트는 십진수 또는 십진수일 수 있으며, 후자의 경우 "x"가 선행한다.선행 0은 생략할 수 있다.명명된 도면요소로 여러 문자를 나타낼 수 있다.

예:HTML/XML에서는 저작권 기호 © (U+00A9)는 다음과 같이 부호화할 수 있다.

  • ©(코드 포인트)
  • ©(196진수 코드 포인트)
  • ©(이름)

이것은 Thunderbird와 위키백과 편집과 같이 HTML 마크업을 받아들이는 많은 소프트웨어에서 작동한다.

참고 항목

메모들

  1. ^ CP1252는 카리브해 섬, 서유럽, 중남아프리카, 호주, 뉴질랜드, 오세아니아에 있는 (구)유럽 식민지와 소유지를 포함한 북아메리카와 남아메리카의 디폴트다.

참조

  1. ^ Lafontaine, Sylvain (February 17, 2012). "Unicode vs ASCII difference and benefits". MSDN. Retrieved 28 February 2014.
  2. ^ a b Andrew Marcuse, "Microsoft Windows에서 유니코드 문자를 입력하는 방법"액세스 날짜:2012년 9월 13일
  3. ^ 이것은 개인용 코드 포인트 U+10FFE이며, 글리프가 할당되어 있지 않기 때문에 대체품을 표시해야 한다.
  4. ^ "ISO/IEC 14755:1997 Information technology -- Input methods to enter characters from the repertoire of ISO/IEC 10646 with a keyboard or other input device". ISO. Retrieved 2017-10-14.
  5. ^ "How to Use Special Characters in Windows Documents". support.microsoft.com. Jul 31, 2019. Retrieved 2020-10-17.
  6. ^ Peck, Akkana (2009-11-25). "Mastering Characters Sets in Linux (Weird Characters, part 2)". LinuxPlanet. Retrieved 2018-12-05.
  7. ^ Opris, Elena (30 January 2018). "UnicodeInput Review". Softpedia. Retrieved November 28, 2018.
  8. ^ "Send Keys & Clicks". AutoHotkey Foundation LLC.
  9. ^ 특수 문자 악센트 문자 입력 웨이백 머신에 2008-03-09 보관
  10. ^ a b Jack Busch (April 20, 2018). "Type Special Characters with a Chromebook (Accents, Symbols, Em Dashes)". groovypost.com. Retrieved February 28, 2020.
  11. ^ Vim 설명서: gui_w32