모듈:유니코드 데이터/문서

Module

사용.

이 모듈은 유니코드 코드 포인트에 대한 정보에 액세스하는 기능을 제공합니다.정보는 유니코드 문자 데이터베이스에서 생성되거나 유니코드 사양에 지정된 규칙에 의해 파생된 데이터 모듈에서 검색됩니다.이 프로그램과 하위 모듈은 영어 위키백과에서 복사한 다음 수정되었습니다. 자세한 내용은 여기를 참조하십시오.

매개변수 및 함수

코드 포인트

코드 포인트는 16진수 값으로 입력해야 합니다.를 들어 U+00A9 © CROWIPTY SIGN:

A9hex
0xA9hex
0x00A9hex
0x00a9hex
{{#invoke:Unicode data lookup name 0x00A9}}저작권 표시

부정확하거나 의도하지 않은 결과:

169dec:{{#invoke:Unicode data lookup name 169}}라틴 문자 작은 문자 U(틸데 포함)Red XN—"U+00A9"©00A9hex(즉, 361dec)로 판독됩니다.
U+00A9 {{#invoke:Unicode data lookup name U+00A9}} Red XN — "U+" 접두사를 사용하지 않음
غ {{#invoke:Unicode data lookup name غ}} Red XN — 문자를 코드 포인트로 입력할 수 없습니다.

"sys" 및 "is" 함수

lookup, is
다음으로 시작하는 기능에 대한 액세스를 허용하는 템플릿 호출 가능 함수lookup그리고.is대부분의 함수에 대해 16진수 기준의 코드 포인트를 다음 파라미터로 추가합니다.위해서is" Latin,is rtl,그리고.is valid_pagename문자열을 추가합니다.텍스트의 HTML 문자 참조는 모듈에 의해 코드 포인트로 디코딩됩니다.
예를들면,{{#invoke:Unicode data is Latin àzàhàr̃iyyā̀}}참의
내부적으로 모듈에서 이러한 함수의 이름은 밑줄을 사용합니다.lookup_name code pointlookup_name
위해서&A9; :{{#invoke:Unicode data lookup name A9}}저작권 표시

기능 개요

다음 표:
  • 코드 포인트: U+0061이 아닌 0x0061 또는 61과 같은 16진수 값을 입력합니다.
주제 기능. 매개 변수 유형
(string=문자별, c.p.x16진수 값별)
돌아온다 성격
유니코드 문자 이름 lookup name 코드 포인트
  • {{#invoke:Unicode data lookup name 0xA9}}
  • {{#invoke:Unicode data lookup name 0x0007}}
  • 저작권 표시
  • <control-0007>
  • ©
  • &#x0007;
스크립트 lookup script 코드 포인트 {{#invoke:Unicode data lookup script A061}} 이이
블록 lookup block 코드 포인트 {{#invoke:Unicode data lookup block A061}} 이음절
평면 lookup plane 코드 포인트
  • {{#invoke:Unicode data lookup plane 0xA9}}
  • {{#invoke:Unicode data lookup plane 0x1F608}}
  • 기본 다국어 평면
  • 보조 다국어 평면
  • ©
  • 😈


일반 범주 lookup category 코드 포인트
  • {{#invoke:Unicode data lookup category 0xA9}}
  • {{#invoke:Unicode data lookup category 0x002B}}
  • 그렇게
  • SM
  • ©
  • +
컨트롤 is control 코드 포인트
  • {{#invoke:Unicode data lookup control A9}}
  • {{#invoke:Unicode data lookup control FFFF}}
  • 맡겨진
  • 미지정의
  • ©
  • &#xFFFF;
라틴 문자 is Latin
  • {{#invoke:Unicode data is Latin abcŁíā̀}}
  • {{#invoke:Unicode data is Latin abc文xyz}}
  • 진실의
  • 거짓의
WP: 기사 제목 (WP:NCTR) is valid_pagename
  • {{#invoke:Unicode data is valid_pagename Main_page}}
  • {{#invoke:Unicode data is valid_pagename # (disambiguation)}}
  • 진실의
  • 거짓의
양방향, 오른쪽에서 왼쪽으로 스크립트 실행 is rtl
  • {{#invoke:Unicode data is rtl ش}}
  • {{#invoke:Unicode data is rtl 34}}
  • 진실의
  • 거짓의
  • ش
  • 4
문자 조합 is combining 코드 포인트
  • {{#invoke:Unicode data is combining 0300}}
  • {{#invoke:Unicode data is combining 64}}
  • 진실의
  • 거짓의
  • ̀
  • d
문자 할당 is assigned 코드 포인트
  • {{#invoke:Unicode data is assigned A061}}
  • {{#invoke:Unicode data is assigned FFEF}}
  • 진실의
  • 거짓의
  • ;
인쇄 가능 is printable 코드 포인트
  • {{#invoke:Unicode data is printable 0061}}
  • {{#invoke:Unicode data is printable 0007}}
  • {{#invoke:Unicode data is printable FFFF}}
  • >참<
  • >거짓<
  • >거짓<
  • >a<
  • >&#x0007;<
  • >&#xFFFF;<
공백 문자 » 유니코드 is whitespace 코드 포인트
  • {{#invoke:Unicode data is whitespace 0x20}}
  • {{#invoke:Unicode data is whitespace 0xA0}}
  • {{#invoke:Unicode data is whitespace 0x64}}
  • >참<
  • >true< NBSP
  • >거짓<
  • > <
  • > <
  • >d<
한글 Hangul [응용 프로그램 알 수 없음]
  • &#x;
  • &#x;
별칭 이름 aliases [응용 프로그램 알 수 없음]
  • &#x;
  • &#x;
결합수업 [응용 프로그램 알 수 없음]
  • &#x;
  • &#x;
나이 [응용 프로그램 알 수 없음]
get_best_script get_best_script [응용 프로그램 알 수 없음]

데이터 모듈

이 모듈의 기능에 사용되는 데이터는 하위 모듈에 있습니다.일부는 User:에 표시된 AWK 스크립트를 통해 생성됩니다.Kephir/Unicode on English Wiktionary, 기타는 Lua 스크립트에 의해 다음과 같이 표시됩니다./make하위 모듈의 하위 페이지입니다.

데이터 모듈 이름(모듈:유니코드 데이터/이름/)xxx가 유니코드 데이터에서 컴파일되었습니다.txt. 각 코드에는 최대 U+xx000 ~ U+xxFF 코드 포인트가 포함됩니다.

문자 이름 데이터 모듈,
16진수 기준으로 코드 포인트의 처음 세 자리로 구성됩니다.
0 1 2 3 4 5 6 7 8 9 A B C D E F
00x U+0000 –
U+0FF
U+1000-
U+1FFF
U+2000-
U+2FFF
U+3000 –
U+3FFF
U+4000-
U+4FF
U+A000-
U+AFF
U+D000-
U+DFFF
U+F000-
U+FFFF
01x U+10000 –
U+10FF
U+11000-
U+11FF
U+12000-
U+12FF
U+13000 –
U+13FF
U+14000-
U+14FF
U+16000-
U+16FF
U+18000 –
U+18FF
U+1A000-
U+1AFF
U+1B000 –
U+1BFFF
U+1C000 –
U+1CFFF
U+1D000 –
U+1DFFF
U+1E000-
U+1EFF
U+1F000-
U+1FFFF
0Ex U+E0000 –
U+E0FFF

저작권

Unicode 데이터베이스는 Unicode Inc.에서 다음과 같은 조건으로 릴리스됩니다.

저작권 © 1991-2018 유니코드, Inc.무단 전재 금지.https://www.unicode.org/copyright.html 의 이용 약관에 따라 배포됩니다.

이에 따라 데이터 파일 또는 소프트웨어를 제한 없이 취급할 수 있는 Unicode 데이터 파일 및 관련 문서("데이터 파일") 또는 Unicode 소프트웨어 및 관련 문서("소프트웨어")의 사본을 획득하는 모든 사용자에게 무료로 사용, 복사, 수정, 수정 권한을 포함하여 데이터 파일 또는 소프트웨어를 제한 없이 처리할 수 있는 권한이 부여됩니다.데이터 파일 또는 소프트웨어의 사본을 병합, 게시, 배포 및/또는 판매하고, (a) 본 저작권 및 허가 통지 중 하나가 데이터 파일 또는 소프트웨어의 모든 사본과 함께 표시되는 경우, 데이터 파일 또는 소프트웨어가 제공되는 개인에게 이를 허용합니다.또는 (b) 본 저작권 및 허가 통지가 관련 문서에 표시됩니다.

데이터 파일 및 소프트웨어는 상품성, 특정 목적에 대한 적합성 및 제3자 권리의 비침해에 대한 보증을 포함하되 이에 국한되지 않고 명시적 또는 묵시적으로 "있는 그대로" 제공됩니다. 어떠한 경우에도 저작권자 또는 소유자는 이 통지에 대해 책임을 지지 않습니다.또는 데이터 파일 또는 소프트웨어의 사용 또는 성능과 관련하여 발생하는 계약상의 행위, 과실 또는 기타 불법 행위에 관계없이 사용, 데이터 또는 이익의 손실로 인한 특별한 간접 또는 결과적 손해 또는 모든 손해.

본 통지에 포함된 경우를 제외하고, 저작권 소유자의 사전 서면 승인 없이 본 데이터 파일 또는 소프트웨어의 판매, 사용 또는 기타 거래를 촉진하기 위해 저작권 소유자의 이름을 광고 또는 기타 방법으로 사용할 수 없습니다.

알려진 문제

  • 데이터 읽기Module:Unicode data/aliases제공되거나 문서화되지 않음
  • 테스트 실패:lookup_category U+FFFF(<noncharacter-FFFF>)가 필요합니다. Cn.
{{#invoke:Unicode data lookup category 0xFFFF}}[닐]

참고 항목

  • 명명된 엔티티: 예: U+22C1 µN-ARY 논리적 또는:{{#invoke:LoadData Numcr2namecr 0x22C1}}&bigve;, &bee;, &xve;