서부 라틴 문자 집합(컴퓨팅)

서유럽 공통 언어에 대한 8비트 문자 집합의 여러 이진 표현을 이 글에서 비교한다. 이러한 인코딩은 라틴 알파벳을 사용하는 이탈리아어, 스페인어, 포르투갈어, 프랑스어, 독일어, 네덜란드어, 영어, 덴마크어, 스웨덴어, 노르웨이어, 아이슬란드어 등을 표현하기 위해 고안되었으며, 사전 컴파일된 문자와 일부 문장 부호 및 다양한 기호(일부 그리스어 문자 포함)를 사용한다. 비록 그들이 "서유럽어"라고 불리고 있지만, 이러한 언어들 중 많은 것들이 전세계에서 사용되고 있다. 또한 이러한 문자 집합은 말레이어, 스와힐리어, 고전 라틴어와 같은 많은 다른 언어들을 지원하게 된다.

이 물질은 기능적으로 유니코드로 대체되어 기술적으로 구식이다. 그러나 그것은 역사적 관심을 계속 가지고 있다.

요약

ISO-8859 시리즈 8비트 문자 집합은 유럽에서 사용되는 모든 라틴 문자 집합을 인코딩하는데, 비록 동일한 코드 포인트가 여러 가지 용도를 가지고 있어서 (모지바케, 또는 왜곡된 문자, 통신 문제를 포함) 어려움을 유발한다. 모든 글리프에 대한 고유한 코드 포인트를 가진 유니코드의 도착은 이러한 문제들을 해결했다.

ISO/IEC 8859-1 또는 라틴-1이 가장 많이 사용되며 유니코드에서 최초의 256 코드를 정의하기도 한다.
ISO/IEC 8859-15는 ISO-8859-1을 수정하여 에스토니아어, 핀란드어, 프랑스어를 완벽하게 지원하고 유로 부호를 추가한다.
Windows-1252는 ISO/IEC 8859-15의 인쇄 가능한 문자와 곡선 인용 부호(Microsoft Word 설정 및 유사한 프로그램 등 스마트 인용 부호라고도 함)와 같은 인기 있는 구두점을 포함하는 ISO-8859-1의 초대형이다. 일반적으로 Windows용 웹 페이지 도구는 Windows-1252를 사용하지만 웹 페이지에 ISO-8859-1을 사용하는 것으로 라벨을 붙이는 것이 일반적이며, 이는 HTML5에서 다루어졌으며, 이는 ISO-8859-1로 표시된 페이지를 Windows-1252로 해석해야 한다.
IBM CP437은 영어 전용으로 고안된 악센트 문자(특히 대문자)는 거의 없지만 여기에 열거된 다른 IBM 코드 페이지보다 그래픽 문자가 훨씬 많고, 기술 기호로 유용한 일부 수학적 및 그리스 문자를 가지고 있다.
IBM CP850은 ISO-8859-1이 가지고 있는 인쇄 가능한 모든 문자를 가지고 있으며(다양하게 배열되어 있음) 여전히 사용 가능한 텍스트 모드 사용자 인터페이스를 구축하기에 충분한 그래픽 문자를 보유하고 있다.
IBM CP858은 한 문자로만 CP850과 다르다. 즉, 터키 밖에서 거의 사용되지 않으며 대문자 등가물이 제공되지 않은 점 없는 점 없는 i(ı)가 유로 통화 부호(€)^[1]로 대체되었다.
IBM CP859에는 ISO/IEC 8859-15가 가지고 있는 인쇄 가능한 문자가 모두 포함되어 있어 CP850과 달리 유로 기호, 에스토니아어, 핀란드어, 프랑스어를 지원한다.
IBM 코드 페이지 037, 500 및 1047은 ISO-8859-1의 모든 문자를 포함하는 EBCDIC 인코딩이다.
Mac OS 로마 문자 세트(흔히 Macroman으로 불리며 IANA에서 단순히 Macintosh로 알려짐)는 ISO/IEC 8859-1과 동일한 문자를 대부분 가지고 있지만 전부는 아니다. 또한 매우 다른 배열로 되어 있다. 또한 많은 기술적, 수학적 문자(중요한 ×는 부족하지만)와 더 많은 분음문자를 추가한다. 이전 매킨토시 웹브라우저는 웹 사이트의 텍스트를 편집할 때 ISO/IEC 8859-1에 있지만 기본 매킨토시 문자 집합은 아닌 몇 개의 문자를 분쇄하는 것으로 알려져 있었다. 반대로, 이전 Macintosh에서 준비된 웹 자료에서, 다른 운영 체제에서 읽을 때 많은 문자가 잘못 표시되었다. ISO/IEC 8859-1을 지원하기 위해 Mac OS Roman을 수정한 Macintosh Latin 인코딩은 이 문제를 해결하기 위해 Kermit(프로토콜)의 크리에이터에 의해 만들어졌다.

역사

이전의 7비트 미국 정보 교환 표준 코드('ASCII') 인코딩에는 영어, 라틴어, 말레이어, 스와힐리어와 같은 몇 개 언어만 적절히 나타낼 수 있는 충분한 문자가 있다. 다른 라틴어-알파벳 언어에서 사용되는 일부 문자와 문자-직교 조합이 누락되어 있다. 그러나 대부분의 미국 공급 컴퓨터 플랫폼에는 다른 선택이 없었기 때문에, 국가 컴퓨팅 산업이 강한 곳 외에는 ASCII를 사용할 수밖에 없었다. ASCII의 일부 기호를 로컬 문자로 대체하는 ISO 646의 인코딩 그룹이 있었지만 공간은 매우 제한적이었으며, 일부 기호는 프로그래밍 언어와 같은 것에서는 상당히 흔했다.

대부분의 컴퓨터는 내부적으로 8비트 바이트를 사용했지만 통신(본래적으로 신뢰할 수 없는 것으로 표시됨)은 7개의 데이터 비트와 1개의 패리티 비트를 사용하였다. 시간이 지남에 따라 8비트를 모두 데이터로 사용하는 것이 일반화 되어 128자를 위한 공간을 만들었다. 초기에는 이들 중 대부분은 시스템별로 다르지만 점차 ISO/IEC 8859 표준이 등장하여 정보 교환이 가능하도록 약간의 교차 플랫폼 유사성을 제공하였다.

20세기 말에 이르러 스토리지와 메모리 비용이 떨어지면서 주어진 8비트 코드(ISO-라틴 코드 세트만 7개)의 다중 의미와 관련된 문제들이 정당화되지 않게 되었다. 모든 주요 운영 체제는 주요 내부 표현으로서 유니코드로 이동했다. 그러나 윈도우는 유니코드를 인코딩하는 UTF-8 방법(UTF-16을 선호함)을 지원하지 않았기 때문에, 많은 어플리케이션들이 이러한 레거시 문자 집합으로 계속 제한되었다.

유로 부호

유로화와 유로 부호는 유로 부호(€)를 지지해야 하는 상당한 압력을 도입했고, 대부분의 8비트 문자 세트는 어떤 식으로든 적응해야 했다.

맥로맨이 탑재된 애플과 솔라리스 OS가 탑재된 선마이크로시스템스가 일반 통화표지판(¤)을 간단히 대체했다. 이것은 조직들이 회사 로고와 같은 다른 용도를 발견했기 때문에 상당한 어려움을 야기했다.
ISO는 ISO 8859, ISO 8859-15의 추가 변형을 도입하였는데, 이 변형은 일반 통화 부호를 유로 부호로 대체하고 일부 다른 기호를 분음 부호로 대체하였다. ISO 8859-15는 광범위한 채택을 받은 적이 없다.
윈도우-1252로 마이크로소프트는 유로 표지를 기존 C1 제어 코드의 틈새(위치 80_hex)에 배치했다.

U+20AC(10진수 8364)에서 유로 부호를 인코딩하는 유니코드를 표준으로 지원하는 운영체제가 업그레이드되면서 이 모든 문제가 해결됐다.

비교표

코드 포인트 U+0000 ~ U+007F는 여기에 나열된 모든 문자 집합에서 직접 매핑되므로 현재 이 표에 표시되지 않는다. ASCII 코딩 표준은 처음 0-127자 매핑에 대한 원래 규격을 정의한다.

테이블은 유니코드 코드 포인트로 배열되어 있다. 문자 집합은 대문자의 IANA 이름으로 여기서 언급된다.

캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
NBSP	U+00A0	A0	A0	A0	FF	FF	CA
¡	U+00A1	A1	A1	A1	AD	AD	C1
¢	U+00A2	A2	A2	A2	9B	BD	A2
£	U+00A3	A3	A3	A3	9C	9C	A3
¤	U+00A4	A4		A4		CF
¥	U+00A5	A5	A5	A5	9D	있다	B4
¦	U+00A6	A6		A6		DD
§	U+00A7	A7	A7	A7		F5	A4
¨	U+00A8	A8		A8		F9	AC
©	U+00A9	A9	A9	A9		B8	A9
ª	U+00AA	AA.	AA.	AA.	A6	A6	BB
«	U+00AB	AB	AB	AB	AE	AE	C7
¬	U+00AC	AC	AC	AC	AA.	AA.	C2
샤이	U+00AD	AD	AD	AD		F0
®	U+00AE	AE	AE	AE		A9	A8
¯	U+00AF	AF	AF	AF		EE	F8
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
°	U+00B0	B0	B0	B0	F8	F8	A1
±	U+00B1	B1	B1	B1	F1	F1	B1
²	U+00B2	B2	B2	B2	FD	FD
³	U+00B3	B3	B3	B3		FC
´	U+00B4	B4		B4		EF	AB
µ	U+00B5	B5	B5	B5	E6	E6	B5
	U+00B6	B6	B6	B6		F4	A6
·	U+00B7	B7	B7	B7	FA	FA	E1
¸	U+00B8	B8		B8		F7	FC
¹	U+00B9	B9	B9	B9		FB
º	U+00BA	BA	BA	BA	A7	A7	기원전
»	U+00BB	BB	BB	BB	AF	AF	C8
¼	U+00BC	기원전		기원전	AC	AC
½	U+00BD	BD		BD	AB	AB
¾	U+00BE	있다		있다		F3
¿	U+00BF	BF	BF	BF	A8	A8	C0
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
À	U+00C0	C0	C0	C0		B7	CB
Á	U+00C1	C1	C1	C1		B5	E7
Â	U+00C2	C2	C2	C2		B6	E5
Ã	U+00C3	C3	C3	C3		C7	CC
Ä	U+00C4	C4	C4	C4	8E	8E	80
Å	U+00C5	C5	C5	C5	8층	8층	81
Æ	U+00C6	C6	C6	C6	92	92	AE
Ç	U+00C7	C7	C7	C7	80	80	82
È	U+00C8	C8	C8	C8		D4	E9
É	U+00C9	C9	C9	C9	90	90	83
Ê	U+00CA	CA	CA	CA		D2	E6
Ë	U+00CB	CB	CB	CB		D3	E8
Ì	U+00CC	CC	CC	CC		DE	ED
Í	U+00CD	CD	CD	CD		D6	EA
Î	U+00CE	CE	CE	CE		D7	EB
Ï	U+00CF	CF	CF	CF		D8	EC
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
Ð	U+00D0	D0	D0	D0		D1
Ñ	U+00D1	D1	D1	D1	A5	A5	84
Ò	U+00D2	D2	D2	D2		E3	F1
Ó	U+00D3	D3	D3	D3		E0	EE
Ô	U+00D4	D4	D4	D4		E2	EF
Õ	U+00D5	D5	D5	D5		E5	CD
Ö	U+00D6	D6	D6	D6	99	99	85
×	U+00D7	D7	D7	D7		9E
Ø	U+00D8	D8	D8	D8		9D	AF
Ù	U+00D9	D9	D9	D9		EB	F4
Ú	U+00DA	DA	DA	DA		E9	F2
Û	U+00DB	DB	DB	DB		EA	F3
Ü	U+00DC	DC	DC	DC	9A	9A	86
Ý	U+00DD	DD	DD	DD		ED
Þ	U+00DE	DE	DE	DE		E8
ß	U+00DF	DF	DF	DF	E1	E1	A7
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
à	U+00E0	E0	E0	E0	85	85	88
á	U+00E1	E1	E1	E1	A0	A0	87
â	U+00E2	E2	E2	E2	83	83	89
ã	U+00E3	E3	E3	E3		C6	8B
ä	U+00E4	E4	E4	E4	84	84	8A
å	U+00E5	E5	E5	E5	86	86	8C
æ	U+00E6	E6	E6	E6	91	91	있다
ç	U+00E7	E7	E7	E7	87	87	8D
è	U+00E8	E8	E8	E8	8A	8A	8층
é	U+00E9	E9	E9	E9	82	82	8E
ê	U+00EA	EA	EA	EA	88	88	90
ë	U+00EB	EB	EB	EB	89	89	91
ì	U+00EC	EC	EC	EC	8D	8D	93
í	U+00ED	ED	ED	ED	A1	A1	92
î	U+00EE	EE	EE	EE	8C	8C	94
ï	U+00EF	EF	EF	EF	8B	8B	95
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
ð	U+00F0	F0	F0	F0		D0
ñ	U+00F1	F1	F1	F1	A4	A4	96
ò	U+00F2	F2	F2	F2	95	95	98
ó	U+00F3	F3	F3	F3	A2	A2	97
ô	U+00F4	F4	F4	F4	93	93	99
õ	U+00F5	F5	F5	F5		E4	9B
ö	U+00F6	F6	F6	F6	94	94	9A
÷	U+00F7	F7	F7	F7	F6	F6	D6
ø	U+00F8	F8	F8	F8		9B	BF
ù	U+00F9	F9	F9	F9	97	97	9D
ú	U+00FA	FA	FA	FA	A3	A3	9C
û	U+00FB	FB	FB	FB	96	96	9E
ü	U+00FC	FC	FC	FC	81	81	9층
ý	U+00FD	FD	FD	FD		EC
þ	U+00FE	FE	FE	FE		E7
ÿ	U+00FF	FF	FF	FF	98	98	D8
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
ı	U+0131					D5	F5
Œ	U+0152		기원전	8C			CE
œ	U+0153		BD	9C			CF
Š	U+0160		A6	8A
š	U+0161		A8	9A
Ÿ	U+0178		있다	9층			D9
Ž	U+017D		B4	8E
ž	U+017E		B8	9E
ƒ	U+0192			83	9층	9층	C4
ˆ	U+02C6			88			F6
ˇ	U+02C7						FF
˘	U+02D8						F9
˙	U+02D9						FA
˚	U+02DA						FB
˛	U+02DB						FE
˜	U+02DC			98			F7
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
˝	U+02DD						FD
Γ	U+0393				E2
Θ	U+0398				E9
Σ	U+03A3				E4
Φ	U+03A6				E8
Ω	U+03A9				EA		BD
α	U+03B1				E0
δ	U+03B4				EB
ε	U+03B5				EE
π	U+03C0				E3		B9
σ	U+03C3				E5
τ	U+03C4				E7
φ	U+03C6				ED
–	U+2013			96			D0
—	U+2014년			97			D1
‗	U+2017					F2
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
‘	U+2018			91			D4
’	U+2019			92			D5
‚	U+201A			82			E2
“	U+201C			93			D2
”	U+201D			94			D3
„	U+201E			84			E3
†	U+2020			86			A0
‡	U+2021			87			E0
•	U+2022			95			A5
…	U+2026			85			C9
‰	U+2030			89			E4
‹	U+2039			8B			DC
›	U+203A			9B			DD
⁄	U+2044						DA
ⁿ	U+207F				FC
₧	U+20A7				9E
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
€	U+20AC		A4	80		(D5)^{[nb 1]}^[2]^[3]	DB
™	U+2122			99			AA.
∂	U+2202						B6
∆	U+2206						C6
∏	U+220F						B8
∑	U+2211						B7
∙	U+2219				F9
√	U+221A				FB		C3
∞	U+221E				EC		B0
∩	U+2229				EF
∫	U+222B						BA
≈	U+2248				F7		C5
≠	U+2260						AD
≡	U+2261				F0
≤	U+2264				F3		B2
≥	U+2265				F2		B3
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
⌐	U+2310				A9
⌠	U+2320				F4
⌡	U+2321				F5
─	U+2500				C4	C4
│	U+2502				B3	B3
┌	U+250C				DA	DA
┐	U+2510				BF	BF
└	U+2514				C0	C0
┘	U+2518				D9	D9
├	U+251C				C3	C3
┤	U+2524				B4	B4
┬	U+252C				C2	C2
┴	U+2534				C1	C1
┼	U+253C				C5	C5
═	U+2550				CD	CD
║	U+2551				BA	BA
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
╒	U+2552				D5
╓	U+2553				D6
╔	U+2554				C9	C9
╕	U+2555				B8
╖	U+2556				B7
╗	U+2557				BB	BB
╘	U+2558				D4
╙	U+2559				D3
╚	U+255A				C8	C8
╛	U+255B				있다
╜	U+255C				BD
╝	U+255D				기원전	기원전
╞	U+255E				C6
╟	U+255F				C7
╠	U+2560				CC	CC
╡	U+2561				B5
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
╢	U+2562				B6
╣	U+2563				B9	B9
╤	U+2564				D1
╥	U+2565				D2
╦	U+2566				CB	CB
╧	U+2567				CF
╨	U+2568				D0
╩	U+2569				CA	CA
╪	U+256A				D8
╫	U+256B				D7
╬	U+256C				CE	CE
▀	U+2580				DF	DF
▄	U+2584				DC	DC
█	U+2588				DB	DB
▌	U+258C				DD
▐	U+2590				DE
캐릭터	코드 포인트	ISO-8859-1	ISO-8859-15	윈도-1252	IBM437	IBM850	매킨토시
░	U+2591				B0	B0
▒	U+2592				B1	B1
▓	U+2593				B2	B2
■	U+25A0				FE	FE
◊	U+25CA						D7
ﬁ	U+FB01						DE
ﬂ	U+FB02						DF

IBM 코드 페이지에 대한 매핑은 Microsoft가 제공하는 유니코드 사이트에서 가져온 것이다. 이러한 코드 페이지에 대한 IBM과 Microsoft의 매핑 간의 차이점에 대해서는 유니코드 컨소시엄의 문서를 참조하십시오.
IBM437 및 IBM850은 제어 코드 범위에 대해 인쇄 가능한 문자를 정의했다. DOS를 통해 텍스트를 인쇄할 때는 화면에 도달하기 전에 갇히게 되므로 사용할 수 없지만, 화면 메모리를 직접 사용하는 애플리케이션에서는 사용할 수 있었다.
매킨토시는 0xF0에 Apple 로고 를 가지고 있으며, 유니코드를 위한 Private Use Area에서 U+F8FF로 번역한다.

메모들

^ 1998년 발표된 IBM의 PC DOS 2000은 새로운 코드 페이지 858에 대한 지원을 추가하는 대신 코드 포인트 213의 유로 부호를 포함하여 코드 페이지 850에 대한 정의를 현재 수정된 코드 페이지 850으로 변경했다. 그 이유는 MS-DOS/PC DOS에 따른 코드 페이지 전환 논리 구현의 기존 제한사항으로 인해 제한되었을 수 있다.CPI 파일은 크기가 64KB이거나 최대 약 6개의 코드 페이지에 저장되는데, 이는 Windows NT에서 MS-DOS의 일부 OEM 버전에서 우회되었으며 DR-DOS에도 존재하지 않는다. 또한 MS-DOS/PC DOS의 파서는 Country에서 가능한 국가/코드 페이지 항목의 수를 제한한다.SYS 파일은 최대 146 또는 438로, DR-DOS에는 존재하지 않는 제한 사항. 따라서 코드 페이지 858에 대한 지원을 추가하는 것은 다른 애플리케이션(예: 코드 페이지 850)을 동시에 떨어뜨리는 것을 의미했을 수 있는데, 이는 일부 애플리케이션이 코드 페이지 850을 사용하도록 유선 연결되었다는 점에서 당시 실행 가능한 해결책이 아닐 수 있었다.

참조

^ "00858". Code pages by CPGID. IBM. Archived from the original on 2016-06-06. Retrieved 2016-06-06.
^ Paul, Matthias R. (2001-08-15). "Changing codepages in FreeDOS" (Technical design specification based on fd-dev post [1]). Archived from the original on 2016-06-06. Retrieved 2016-06-06. The new official ID for the Multilingual "codepage 850 with EURO SIGN" is 858, not 850. IBM will switch to use 858 instead of their 850 variant with future issues of their products. [...] I can only guess why they didn't add 858 to their EGAx.CPI, COUNTRY.SYS, and KEYBOARD.SYS files in PC DOS 2000. Many third-party applications are designed to work with 850 and didn't know about 858 at the time PC DOS 2000 was released, so it's easier for everyone, but unfortunately it's not compatible. [...] As explained above, COUNTRY.SYS and KEYBOARD.SYS contain only two codepage entries for a given country in Western issues of DOS. (In Arabic and Hebrew issues there can be up to 8 codepages for one country, in theory there is no limit below the range of allowed codepages 1..65534). [...] The problem is that removing support for 850 might have caused compatibility problems with applications which are hard-wired to use 850. Adding 858 as a third choice to all the files would have increased the file and table sizes significantly. The COUNTRY.SYS file parser in MS-DOS/PC DOS IO.SYS/IBMBIO.COM sets aside a 6 Kb (for DOS 6) scratchpad to load all the info. This allows a maximum of 438 entries in a COUNTRY.SYS file to be accepted, otherwise you will get the message "COUNTRY.SYS too large.". The NLSFUNC parser does not have this limitation, and the file parsers in DR-DOS (kernel and NLSFUNC) also do not know of such a restriction. Older issues of MS-DOS/PC DOS even had a 2 Kb buffer for a maximum of 146 entries.
^ Paul, Matthias R. (2001-08-27). "Changing codepages in FreeDOS (follow-up)". Archived from the original on 2014-10-01. Retrieved 2013-05-08. [...] one could also create custom .CPI files in the traditional FONT style without difficulties, but you could only store up to [...] six codepages in such a file if it should be useable by MS-DOS/PC DOS (some OEM issues and NT can handle files larger than 64 Kb, but MS-DOS/PC DOS can not).

[NB_PCDOS_CP850-2] 1998년 발표된 IBM의 PC DOS 2000은 새로운 코드 페이지 858에 대한 지원을 추가하는 대신 코드 포인트 213의 유로 부호를 포함하여 코드 페이지 850에 대한 정의를 현재 수정된 코드 페이지 850으로 변경했다. 그 이유는 MS-DOS/PC DOS에 따른 코드 페이지 전환 논리 구현의 기존 제한사항으로 인해 제한되었을 수 있다.CPI 파일은 크기가 64KB이거나 최대 약 6개의 코드 페이지에 저장되는데, 이는 Windows NT에서 MS-DOS의 일부 OEM 버전에서 우회되었으며 DR-DOS에도 존재하지 않는다. 또한 MS-DOS/PC DOS의 파서는 Country에서 가능한 국가/코드 페이지 항목의 수를 제한한다.SYS 파일은 최대 146 또는 438로, DR-DOS에는 존재하지 않는 제한 사항. 따라서 코드 페이지 858에 대한 지원을 추가하는 것은 다른 애플리케이션(예: 코드 페이지 850)을 동시에 떨어뜨리는 것을 의미했을 수 있는데, 이는 일부 애플리케이션이 코드 페이지 850을 사용하도록 유선 연결되었다는 점에서 당시 실행 가능한 해결책이 아닐 수 있었다.

[IBM2-1] "00858". Code pages by CPGID. IBM. Archived from the original on 2016-06-06. Retrieved 2016-06-06.

[Paul_2001_CPSwitch-438-Entries-3] Paul, Matthias R. (2001-08-15). "Changing codepages in FreeDOS" (Technical design specification based on fd-dev post [1]). Archived from the original on 2016-06-06. Retrieved 2016-06-06. The new official ID for the Multilingual "codepage 850 with EURO SIGN" is 858, not 850. IBM will switch to use 858 instead of their 850 variant with future issues of their products. [...] I can only guess why they didn't add 858 to their EGAx.CPI, COUNTRY.SYS, and KEYBOARD.SYS files in PC DOS 2000. Many third-party applications are designed to work with 850 and didn't know about 858 at the time PC DOS 2000 was released, so it's easier for everyone, but unfortunately it's not compatible. [...] As explained above, COUNTRY.SYS and KEYBOARD.SYS contain only two codepage entries for a given country in Western issues of DOS. (In Arabic and Hebrew issues there can be up to 8 codepages for one country, in theory there is no limit below the range of allowed codepages 1..65534). [...] The problem is that removing support for 850 might have caused compatibility problems with applications which are hard-wired to use 850. Adding 858 as a third choice to all the files would have increased the file and table sizes significantly. The COUNTRY.SYS file parser in MS-DOS/PC DOS IO.SYS/IBMBIO.COM sets aside a 6 Kb (for DOS 6) scratchpad to load all the info. This allows a maximum of 438 entries in a COUNTRY.SYS file to be accepted, otherwise you will get the message "COUNTRY.SYS too large.". The NLSFUNC parser does not have this limitation, and the file parsers in DR-DOS (kernel and NLSFUNC) also do not know of such a restriction. Older issues of MS-DOS/PC DOS even had a 2 Kb buffer for a maximum of 146 entries.

[Paul_2001_CPSwitch-64KB-Size-4] Paul, Matthias R. (2001-08-27). "Changing codepages in FreeDOS (follow-up)". Archived from the original on 2014-10-01. Retrieved 2013-05-08. [...] one could also create custom .CPI files in the traditional FONT style without difficulties, but you could only store up to [...] six codepages in such a file if it should be useable by MS-DOS/PC DOS (some OEM issues and NT can handle files larger than 64 Kb, but MS-DOS/PC DOS can not).

[1]

[nb 1]

[2]

[3]

hide v t 캐릭터 인코딩
초기 통신	전신코드 바늘 모르스 비라틴어 와분/카나 중국어 키릴의 한국인입니다 바우도트와 머레이 필다타 ASCII ISO/IEC 646 BCDIC 353 355 357 358 359 360 EBCDIC 텔레텍스 및 비디오텍스/텔레텍스 ISO/IEC 6937 / ITU T.51 ITU T.61 ITU T.101 월드 시스템 텔레텍스트 배경 놓다
ISO/IEC 8859	승인된 부품 -1 (서유럽) -2(중부 유럽) -3 (말테세/에스페란토) -4(북유럽) -5(키릴 문자) -6 (아랍어) -7 (그리스어) -8 (히브루) -9 (터키어) -10(Nordic) -11 (타이) -13(발틱) -14(셀틱) -15(신서유럽) -16(로마어) 버려진 부품 -12 (데바나가리) 제안되었지만 승인되지 않음 KOI-8 키릴 문자 사미 프랑스어/네덜란드어/터키어 적응 웨일스어 바렌츠 키릴어 볼가 키릴 문자 에스토니아어 우크라이나 키릴 문자
서지학 용법	MARC-8 안셀 CCCII/EACCII ISO 5426 / 5426-2 / 5427 / 5428 / 6438 / 6861 / 6862 / 8957 / 10585 / 10754 / 11822
국가표준	암SCIII 브라SCIII CNS 11643 ELOT 927 GOST 10859 GB 2312 GB 12052 GB 18030 HKCS I.S. 434 ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KOI-7 KPS 9566 KS X 1001 KS X 1002 LST 1284 LST 1564 LST 1590-1 LST 1590-2 LST 1590-3 LST 1590-4 파스씨아 루스씨아 SI 960 TIS-620 TSCII VISCII VSCII YASCII
ISO/IEC 2022	7비트 씨엔. CN-EXT JP JP-EXT JP-1 JP-2 JP-3 KR ISO/IEC 4873 ISO/IEC 8859 ISO/IEC 10367 확장 Unix 코드 / EUC 씨엔. KR JP TW
Mac OS 코드 페이지 ("실제")	아르메니아어 아랍어 바렌츠 키릴어 켈트족 센트로 유로 중국어심프 / EUC-CN 중국어전통 / 빅5 크로아티아어 키릴의 데바나가리 / ISCII 딩배츠 파르시 (페르시아어) 글꼴 X(커밋) 게일어 조지아 주 그리스어 구자라티 / ISCII 구르무크히 / ISCII 히브리어 아이슬란드 이누이트 일본어 / Shift JIS 키보드 한국어 / EUC-KR 라틴어(Kermit) 말타세/에스페란토 오함 / I.S. 434 로만 루마니아어 사미 기호 태국어 / TIS-620 터키어 투르크 키릴 문자 우크라이나어 VT100
DOS 코드 페이지	100 111 112 113 151 152 161 162 163 164 165 166 210 220 301 437 449 489 620 667 668 706 707 708 709 710 711 714 715 720 721 737 768 770 771 772 773 774 775 776 777 778 790 850 851 852 853 854 855/872 856 857 858 859 860 861 862 863 864 865 866/808 867 868 869 874/1161/1162 876 877 878 881 882 883 884 885 891 895 896 897 898 899 900 903 904 906 907 909 910 911 926 927 928 929 932 934 936 938 941 942 943 944 946 947 948 949 950/1370 951 966 991 1034 1039 1040 1041 1042 1043 1044 1046 1086 1088 1092 1093 1098 1108 1109 1114 1115 1116 1117 1118 1119 1125/848 1126 1127 1131/849 1139 1167 1168 1300 1351 1361 1362 1363 1372 1373 1374 1375 1380 1381 1385 1386 1391 1392 1393 1394 3012 3021 3843 3844 3845 3846 3847 3848 30000 30001 30002 30003 30004 30005 30006 30007 30008 30009 30010 30011 30012 30013 30014 30015 30016 30017 30018 30019 30020 30021 30022 30023 30024 30025 30026 30027 30028 30029 30030 30031 30032 30033 30034 30039 30040 58152 58210 58335 59234 59829 60258 60853 61282 62306 CS 인디케이터 CSX 인디케이터 CSX+ 인디케이터 CWI-2 이란 시스템 카메니키슈 KOI8 마조비아 MIK
IBM AIX 코드 페이지	367 371 806 813 819 895 896 912 913 914 915 916 919 920 921/901 922/902 923 952 953 954 955 956 957 958 959 960 961 963 964 965 970 971 1004 1006 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1029 1036 1089 1111 1124 1129/1163 1133 1350 1382 1383
다음에 대한 IBM 코드 페이지 다른 상인들의 인코딩	애플 매킨토시 1275 1280 1281 1282 1283 1284 1285 1286 어도비 1038 1276 1277 DEC 1020 1021 1023 1090 1100 1101 1102 1103 1104 1105 1106 1107 1287 1288 HP 1050 1051 1052 1053 1054 1055 1056 1057 1058
Windows 코드 페이지	CER-GS 874/1162(TIS-620) 932/943 (시프트 JIS) 936/1386(GBK) 950/1370(Big5) 949/1363(EUC-KR) 1169 1174 확장 라틴어-8 1200(UTF-16LE) 1201(UTF-16BE) 1250 1251 1252 1253 1254 1255 1256 1257 1258 1261 1270 54936(GB18030) 아르메니아어 키릴어 + 핀란드어 키릴 + 프랑스어 키릴 + 독일어 폴리토닉 그리스어 65001(UTF-8)
다음에 대한 Microsoft 코드 페이지 다른 상인들의 인코딩	애플 매킨토시 10000 10001 10002 10003 10004 10005 10006 10007 10008 10010 10017 10021 10029 10079 10081 10082
EBCDIC 부호화	37/1140 37-2 273/1141 300/16684 290/8482/20290 390 391 392 393 394 395 424 435 500/1148 829 834 835 837 839 875 881 882 883 884 885 886 887 888 889 890 924 930/1390 931 933/1364 935/1388 937/1371 939/1399 1001 1003 1005 1007 1024 1026 1027/5123 1028 1030 1031 1032 1033 1037 1047 1068 1071 1073 1074 1075 1076 1077 1078 1080 1082 1083 1085 1087 1091 1136 1150 1151 1152 1278 1279 1303 1376 1377 JEF KEIS
DEC 단자(VTx)	다국적(MCS) 국가 교체(NRCS) 프랑스계 캐나다인 스위스인 스페인어 영국 네덜란드어 핀란드어 프랑스어 노르웨이어와 덴마크어 스웨덴의 노르웨이 및 덴마크어(대체) 8비트 그리스어 8비트 터키어 7비트 히브리어 8비트 히브리어 특수 그래픽스 기술(TCS)
플랫폼별	도토리 어도비 스탠더드 어도비 라틴어 1 암스트라드 CPC 애플 1세 애플 II 애플 III AT ASCII 아타리 ST 빅스 카시오 계산기 CDC 콤푸콜로 2세 CP/M+ DEC RADIX 50 DEC MCS/NRCS DG 인터내셔널 주니어 주니어 필자타 GEM 지오스 GSM 03.38 HP 로마 확장기 HP 로마-8 HP 로마-9 HP 초점 HP RPL IBM 스쿼제 릭스 LMBCS 물병자리 마텔 미니텔 MSX NEC APC NEXT 오리크SCIII PCW 펫시씨아 세가 SC-3000 날카로운 계산기 샤프 MZ 싱클레어 QL 텔레텍스트 TI 계산기 TRS-80 벤투라 인터내셔널 벤투라 기호 위시씨아 XCCS ZX80 ZX81 ZX 스펙트럼
유니코드 / ISO/IEC 10646	UTF-1 UTF-7 UTF-8 UTF-16(UTF-16LE/UTF-16BE) / UCS-2 UTF-32(UTF-32LE/UTF-32BE) / UCS-4 UTF-EBCDIC GB 18030 보쿠-1 CESU-8 SCSU
TeX형식설정시스템	코르크 IL1 IL2 IL3 L7X LGR LY1 OML OMS OMX OT1 OT2 OT3 OT4 PL0 QX T2A T2B T2C T2D T3 T4 T5 TS1 TS3 U X2
기타코드페이지	ABICOMP APL 293 310(그래픽 이스케이프) 351(GDDM) 907(OEM) ISO-IR-68 아리브 성-B24 HZ IEC-P27-1 이니스 7비트 8비트 키릴의 ISO-IR-169 ISO 2033 조합 모지쿄 시씨아 스탠퍼드/ITS TACE16 트론 UTF-5 UTF-6 WTF-8
제어 및 비인쇄 캐릭터 세트	모스 프로시그스 C0 및 C1 제어 코드 ISO/IEC 6429 / ANSI X3.64 / ECMA-48 / JIS X 0211 ISO 6630 DIN 31626 JIS X 0207 ITU T.101 C0 C1 EBCDIC 제어 코드 유니코드 제어, 형식 및 구분 문자 공백 문자
관련 항목	코드 페이지 Windows 코드 페이지 CCSID HTML의 문자 인코딩 문자 집합 탐지 한통일 하드웨어 코드 페이지 모히바케 가변 폭 인코딩
문자 집합

Search

서부 라틴 문자 집합(컴퓨팅)

네임스페이스

더

목차

요약

역사

유로 부호

비교표

메모들

참조