DBCS
DBCS![]() |
Double-Byte Character Set(DBCS; 더블바이트 문자 세트)는 모든 문자(컨트롤 문자 포함)가 2바이트로 부호화되거나 부수되는 Single-Byte 문자 세트(SBCS; 싱글바이트 문자 세트)로 표시되지 않는 모든 그래픽 문자가 2바이트로 부호화되는 문자 인코딩입니다(한 문자는 일반적으로 이러한 2바이트 문자의 대부분을 구성합니다).. DBCS는 다수의 고유 문자 또는 기호를 포함하는 국가 언어를 지원합니다(1바이트로 표시할 수 있는 최대 문자 수는 256자, 2바이트는 최대 65,536자를 나타냅니다).그러한 언어의 예로는 일본어와 중국어가 있다.한글은 글자 수는 많지 않지만 KS X 1001은 한글과 한자를 모두 지원하며 한 글자당 2바이트를 사용합니다.
CJK(중국어/일본어/한국어) 컴퓨팅 분야
DBCS라는 용어는 전통적으로 각 그래픽 문자가 2바이트로 인코딩되는 문자 인코딩을 가리킵니다.
Big-5 또는 Shift JIS와 같은 8비트 코드에서 DBCS로부터의 문자는 최상위 비트 세트(즉, 7비트 이상)를 가진 리드(첫 번째) 바이트로 나타나며, 싱글 바이트 문자 세트(SBCS)와 짝을 이룬다.수정되지 않은 시판 소프트웨어와의 호환성을 유지하기 위해 SBCS는 반각 문자로, DBCS는 전각 문자로 관련지어집니다.ISO-2022-JP 등의 7비트코드에서는 에스케이프 시퀀스 또는 시프트코드를 사용하여 SBCS와 DBCS를 전환합니다.
때때로 "DBCS"라는 용어의 사용은 ISO 2022를 준수하지 않는 기초 구조를 의미할 수 있다.예를 들어 "DBCS"는 특별히 확장 UNIX 코드(EUC)가 아닌 더블바이트 인코딩을 의미할 수 있습니다.
DBCS의 원래 의미는 오늘날 일부에서 올바른 사용법으로 간주하는 것과는 다릅니다.일부에서는 EUC-JP, EUC-KR, EUC-TW, GB 18030, UTF-8 등의 문자 인코딩은 일부 문자에 대해 2바이트를 넘는 바이트를 사용하며 문자 이외의 문자에 대해서는 1바이트를 지원하기 때문에 이러한 문자 인코딩을 적절하게 Multi-Byte Character Set(MBCS; 멀티바이트 문자 세트) 또는 가변 폭 인코딩이라고 부르도록 주장하고 있습니다.
애매모호함
UTF-16 및 UTF-8 인코딩을 의미하기 위해 DBCS를 사용하는 사람도 있고 문자당 1바이트 이상을 사용하는 오래된(Unicode 이전) 문자 인코딩을 의미하기 위해 DBCS라는 용어를 사용하는 사람도 있습니다.Shift JIS, GB 2312 및 Big5는 문자당1바이트 이상을 포함할 수 있는 소수의 문자 인코딩이지만, 이러한 문자 인코딩에 DBCS라는 용어를 사용하는 것조차 잘못된 용어입니다.이는 이러한 문자 인코딩이 실제로는 가변 폭 인코딩이기 때문입니다(UTF-16과 UTF-8 모두 마찬가지).일부 IBM 메인프레임에는 실제 DBCS 코드 페이지가 있으며, 여기에는 멀티바이트 코드 페이지의 이중 바이트 부분만 포함됩니다.
소프트웨어의 국제화에 「DBCS enabled」라고 하는 용어를 사용하고 있는 경우는, 애매한 용어를 사용하고 있습니다.코드 페이지가 있는 오래된 기술을 사용하여 동아시아 시장을 위한 소프트웨어를 작성하거나 유니코드를 사용할 계획을 세우고 있다는 의미입니다.때때로 이 용어는 동아시아 언어로 번역하는 것을 의미하기도 한다.통상, 「유니코드 유효화」란, 유니코드를 사용해 소프트웨어를 국제화하는 것을 의미하며, 「DBCS 유효화」란, 동아시아 각국에 존재하는 호환성이 없는 문자 부호화를 사용해 소프트웨어를 국제화하는 것을 의미한다.다른 많은 문자 인코딩과 달리 Unicode는 동아시아의 모든 주요 언어를 지원하므로 일반적으로 Unicode를 사용하는 소프트웨어를 활성화하고 유지하는 것이 더 쉽습니다.DBCS(비유니코드) 활성화는 일반적으로 훨씬 오래된 운영 체제나 응용 프로그램이 Unicode를 지원하지 않는 경우에만 필요합니다.
TBCS
Triple-Byte Character Set(TBCS; 트리플 바이트 문자 세트)는 문자(컨트롤 문자 포함)가 3바이트로 인코딩되는 문자 인코딩입니다.
「 」를 참조해 주세요.
외부 링크
- Microsoft의 "더블 바이트 문자 집합" 정의
- IBM이 Wayback Machine에서 정의한 "더블 바이트 문자 집합"(2018년 10월 18일 보관)