YES 스트로크 알파벳 순서
YES stroke alphabetical orderYES 스트로크 정렬() 또는 YES 스트로크 정렬()은 스트로크 알파벳과 스트로크 정렬을 기반으로 하는 한자 정렬 방법입니다.[1] [a] 스트로크 계수 및 [2]그룹화가 없는 단순화된 스트로크 기반 정렬 방법입니다.
YES 순서는 신화 문자 사전과 시안다이 한유 단어 사전의 모든 문자 색인에 성공적으로 적용되었습니다.이 공동 색인에서 사용자는 알파벳 순으로 한자를 검색하여 인기 있는 두 [3]사전의 페이지 번호 외에도 해당 핀과 유니코드를 찾을 수 있습니다.
스트로크 알파벳
옥스포드 고급 학습자 사전에서 알파벳은 "언어를 [4]쓰는 데 사용되는 고정된 순서의 문자 또는 기호 집합"으로 정의됩니다.YES "알파벳"은 한자 획을 다음 순서로 나열한 것입니다.
"㇐ ㇕ ㇅ ㇎ ㇡ ㇋ ㇊ ㇍ ㇈ ㇆ ㇇ ㇌ 飞[b] ㇀ ㇑ ㇗ ㇞ ㇉ ㄣ ㇙ ㇄ ㇟ ㇚ ㇓ ㇜ ㇛ ㇢ ㇔ ㇏ ㇂".[5]
이 스트로크 알파벳은 유니코드 CJK 스트로크와 GB13000의 한자 벤딩 스트로크 표준을 기반으로 작성되었습니다.1 문자 집합.[7]획수는 모두 30개로, 표준 기본 획순인 "행(橫), 横(提), 티(豎), 수(撇), 파이(丿), 丶(點), 捺(点, ㇏), 钩(彎, 弯), 鉤(折, 一), 丨(㇀, 竖), [8]".(▁(, 钩, ▁points), ▁order(he, ), ▁and), ,(▁bending), ▁((鉤), ▁there(z, ▁", ,), ▁of(捺, ▁gou, ▁"(▁by, ▁wan, ▁basic
스트로크 순서
한자는 일정한 순서로 획을 그어 씁니다.대만과 중국 본토의 표준 스트로크 순서는 상당히 [9]유사합니다.[10] [11]
예를 들어, "YES Stroke-order sorting"(YES Stroke-order sorting)에서 서로 다른 문자의 스트로크 순서는 다음과 같습니다.
一(一) 二(一一) 三(一一一) 笔(㇓㇐㇔㇓㇐㇔㇓㇐㇐㇟) 顺(㇓㇑㇑㇐㇓㇑㇕㇓㇔) 排(㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐) 检(㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐) 法(㇔㇔㇀㇐㇑㇐㇜㇔) 筆(㇓㇐㇔㇓㇐㇔㇕㇐㇐㇐㇐㇑) 順(㇓㇑㇑㇐㇓㇑㇕㇐㇐㇐㇓㇔) 檢(㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔),
여기서 각 문자의 스트로크 순서는 대괄호에 입력된 스트로크 문자열입니다.한자에 대해 두 개 이상의 글리프 또는 스트로크 순서가 있는 드문 경우, YES는 GB13000 표준의 글꼴 및 스트로크 순서를 따릅니다.1 이 표준은 20,902개의 유니코드 CJK 문자를 모두 포함하고 더 많은 사용자를 보유하고 있기 때문에 현재 구현 중인 문자 집합 한자 순서(스트로크 기반 순서)입니다.이론적으로 어떠한 표준의 스트로크 순서도 YES에 사용할 수 있습니다.[1]
YES 정렬
획 알파벳과 획 순서에 대한 지식으로 사용자는 이제 한자와 단어를 알파벳 순으로 정렬(또는 조회)할 준비가 되었습니다.
문자 정렬
두 개의 한자를 YES 순서로 정렬하기 위해 사용자는 라틴 알파벳 [1]순서와 동일한 규칙을 따릅니다.먼저 두 캐릭터의 스트로크 순서 중 첫 번째 스트로크를 비교합니다.서로 다른 경우에는 알파벳의 획순에 따라 문자를 배열합니다(예를 들어, "土(㇐)㇐"는 알파벳의 첫 획 "㇑"보다 앞에 있기 때문입니다). 첫 획 "㇐"이 첫 획 "日"보다 앞에 있기 때문입니다. 첫 획이 같은 경우에는 양쪽의 두 번째 획을 비교합니다.같은 것이 아닌 한 쌍의 획이 발견되고 그에 따라 한자가 정렬될 때까지(예를 들어, 세 번째 획 "㇐"가 "木"보다 앞서기 때문에 "土(㇐)"가 앞에 옵니다).문자 중 하나의 마지막 스트로크를 비교하고 양쪽 스트로크가 다시 동일하면 짧은 스트로크 순서 문자열이 먼저 옵니다(예: "二(一)"이 "三(一)" 앞에 옵니다).
" 二三笔排一排檢法順筆一二三法检"의 여러 문자의 YES 순서는 다음과 같습니다.
一(一) 二(一一) 三(一一一) 檢(㇐㇑㇓㇔㇓㇏㇐㇑㇕㇐㇑㇕㇐㇓㇔㇓㇔) 检(㇐㇑㇓㇔㇓㇏㇐㇔㇔㇓㇐) 排(㇐㇚㇀㇑㇐㇐㇐㇑㇐㇐㇐) 筆(㇓㇐㇔㇓㇐㇔㇕㇐㇐㇐㇐㇑) 笔(㇓㇐㇔㇓㇐㇔㇓㇐㇐㇟) 順(㇓㇑㇑㇐㇓㇑㇕㇐㇐㇐㇓㇔) 顺(㇓㇑㇑㇐㇓㇑㇕㇓㇔) 法(㇔㇔㇀㇐㇑㇐㇜㇔),
단어 정렬
여러 문자의 단어는 첫 문자 순으로 예순으로 정렬됩니다.첫 번째 문자가 동일한 경우 두 번째 문자를 확인한 다음 계속합니다.한자 이외의 문자는 알파벳/유니코드 순서의 한자 뒤에 나타납니다.[13] 예를 들면,
覺 覺醒 觉 觉醒 觉悟 B超 T恤.
적용들
YES 순서는 다음을 포함한 여러 책의 편집에 적용되었습니다.
- 중국어판 YES 획순 정렬 핸드북(중국어판, 신화 사전과 시안다이 한유 [3]치뎬의 13,000자 이상에 대한 공동 색인이 있는 276페이지의 포켓북)
- YES-CEDICT 중국어 사전(11만 개 이상의 단어 [14]항목으로 구성된 중국어-영어 사전, 평가판, 번체 중국어별 정렬).
- YES-CEDICT 중국어 사전(11만 개 이상의 단어 항목으로 구성된 중국어-영어 사전, 평가판, 간체 중국어별 정렬)[15][c]
또한 20,902개의 유니코드 CJK 통합 한자도 모두 YES [16]순으로 정렬되었습니다.
몇 마디 더
기존의 스트로크 기반 정렬과 비교하여 YES의 가장 중요한 장점은 다음과 같습니다. (a) 스트로크 계수 및 그룹화(예: heng-shu-pie-dian-zhe 5 그룹으로)가 필요하지 않습니다. (b) 스트로크 알파벳 순서의 사용.[17]
실험 결과에 따르면 YES의 1계층 스트로크 순서 정렬은 기존의 2계층 스트로크 카운트 스트로크 순서 정렬보다 더 정확합니다.예를 들어, 전통적인 방법에서는 "夊夂久么凡丸及勺夕点折撇㇐㇔"의 9자는 모두 3 획이고 354(pie-zhe-dian, ㇕---点, ㇐㇔)의 동일한 획 순서 코드를 공유하기 때문에 정렬할 수 없습니다.YES 방법은 6개 그룹으로 분류할 수 있습니다. " 凡/丸/夕/夊/么/夂/久"20,902개의 CJK 문자 집합에 대한 전통적인 방법의 코드 복제율(码率重)은 10.31%입니다.그리고 YES 순으로 2.75%로 감소합니다.코드를 공유하는 최대 문자 수는 甲曱叶申와 같이 4개로 줄어듭니다. (중복된 코드 문자, 즉 스트로크 순서 코드를 공유하는 문자는 해당 스트로크의 시작점과 종료점의 위치를 기준으로 오른쪽 아래와 왼쪽 순서로 정렬됩니다.)[2]
참고로, YES 정렬 방법의 중국어 이름, 즉 "一三"(1, 2, 3)은 YES 순서의 모든 한자 중 처음 세 개에 의해 형성됩니다(왜냐하면 획 "一"가 알파벳의 맨 위에 있기 때문입니다).그리고 영어 이름 "YES"는 "Yi Er San"의 머리글자입니다. 이것은 중국 이름의 Pinyin 표현입니다.
메모들
레퍼런스
- ^ a b c Zhang 2013a, 5페이지
- ^ a b Zhang 2013a, 274페이지
- ^ a b Zhang, Xiaoheng et. al (张小衡, 李笑通) (2013a). 一二三笔顺检字手册 (Handbook of the YES Stroke-Order Sorting for Chinese Characters) (in Chinese). Beijing: the Language Press (语文出版社) of the National Language Commission of China. ISBN 978-7-80241-670-3.
- ^ Hornby, A S (2015). Oxford Advanced Learner's Dictionary (9th ed.). Oxford: Oxford University Press. ISBN 978-0-19-479879-2.
- ^ Zhang 2013a, 페이지 전면 커버 내부 측면
- ^ "Unicode CJK Strokes" (PDF). The Unicode Standard. Retrieved 2023-06-21.
- ^ PRC, National Language Commission (2002). GB13000.1字符集汉字折笔规范 (Standard of Chinese character bending strokes of the GB13000.1 character set). Beijing: 语文出版社 (the Language Press). ISBN 978-7-80-126882-2.
- ^ Zhang 2013a, 5-6페이지
- ^ Zhang, X. (and Cheung W. K) (2013b). "A Mainland-Taiwan Comparative Study on Standard Stroke Orders of Chinese Characters (兩岸漢字規範筆順比較)" (PDF). Newsletter of Chinese Language (中國語文通訊). 92 (2013) (1): 17–26.
- ^ Taiwan, 國語推行委員會 (National Language Promotion Committee) (1996). 常用國字標準字體筆順手册 (Handbook of the Stroke Orders of the Commonly-Used National Chinese Characters) (in Chinese). Taipei: Ministry of Education. ISBN 978-9-57-090664-6.
- ^ PRC, National Language Commision (2021). 通用规范汉字笔顺规范 (Stroke Orders of the Commonly-used Standard Chinese Characters) (in Chinese). Beijing: the Commercial Press. ISBN 978-7-100-19347-4.
- ^ National Language Commission of China (October 1, 1999). "GB13000.1字符集汉字字序(笔画序)规范 (Standard of GB13000.1 Character Set Chinese Character Order (Stroke-Based Order))" (PDF) (in Chinese). Shanghai Education Press. ISBN 7-5320-6674-6.
- ^ Zhang, X. (Li, X. and Lin, S.) (2015b). "A Brief Introduction to the YES-CEDICT Chinese Dictionary (《一二三汉英大词典》简介)". The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 4 (2015) (1): 27–31.
- ^ Zhang, X; Li, X; Lun, C. (2015a). "The YES-CEDICT Chinese Dictionary (一二三漢英大詞典, Trial Edition, Sorted by Traditional Chinese)". The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 4 (1): link to the book – via link to the book.
- ^ Zhang, X; Li, X; Lun, C. (2015c). "The YES-CEDICT Chinese Dictionary (一二三汉英大词典, Trial Edition, Sorted by Simplified Chinese)". The Journal of Modernization of Chinese Language Education (中文教学现代化学报). 4 (1): link to the book – via link to the book.
- ^ Zhang, Xiaoheng (2015). "Building a collation element table for a large Chinese character set in YES". Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data - Lecture Notes in Computer Science. Switzerland: Springer Verlag. pp. 3–14. ISBN 9783319258157.
- ^ Zhang 2013a, 274–275페이지
- ^ Zhang 2015a, 페이지 7. 오류::