이진 코드 목록

이것은 2진수 "0"과 "1"의 순서로 텍스트를 나타내는 데 사용된 일부 2진수 코드 목록이다. 고정 폭의 이진 코드는 정해진 수의 비트를 사용하여 텍스트의 각 문자를 나타내며, 가변 폭의 이진 코드에서는 비트 수가 문자마다 다를 수 있다. 이진 코드는 컴퓨터 언어를 읽는 데 사용된다.

5비트 이진 코드

몇 개의 서로 다른 5비트 코드가 초기 펀치 테이프 시스템에 사용되었다.

문자당 5비트는 32개의 다른 문자만 허용하기 때문에, 5비트 코드 중 많은 수가 FIGS(그림)와 LTRS(문자)라고 불리는 값당 2개의 문자 집합을 사용했고, 이들 세트의 사이를 전환하기 위해 2개의 문자를 예약했다. 이를 통해 60자를 효과적으로 사용할 수 있었다.

표준 5비트 표준 코드는 다음과 같다.

국제 텔레그래프 알파벳 1번(ITA1) – 흔히 Baudot code라고도^[1] 한다.
국제 텔레그래프 문자 2번(ITA2) – 일반적으로 Murray^[1]^[2] 코드라고도 함
미국 Teletypewriter 코드(USTTY) – 미국에서^[2] 사용되는 ITA2의 변형
DIN 66006 – 종이 테이프 및 펀치 카드에 ALGOL/ALCOR 프로그램을 표시하기 위해 개발됨

다음의 초기 컴퓨터 시스템은 각각 고유한 5비트 코드를 사용했다.

흔히 베이컨의 암호로 알려진 스테가노그래픽 코드는 알파벳 문자를 나타내기 위해 5개의 이진수 값 원소 그룹을 사용한다.

6비트 이진 코드

한 글자당 6비트를 사용하면 64개의 구별되는 문자를 표현할 수 있다.

6비트 이진 코드의 예는 다음과 같다.

국제 텔레그래프 알파벳 4번(^[4]ITA4)
초기 메인프레임 컴퓨터에서 사용되는 6비트 BCD(이진 코드 십진법).
원시 7비트 ASCII의 6비트 ASCII 하위 집합II
점자 – 점자 문자는 직사각형으로 배열된 6개의 점 위치를 사용하여 표현된다. 각각의 위치는 상승된 점을 포함하거나 포함하지 않을 수 있으므로 점자는 6비트 바이너리 코드로 간주할 수 있다.

참고 항목: 6비트 문자 코드

7비트 이진 코드

7비트 이진 코드의 예는 다음과 같다.

국제 텔레그래프 알파벳 3번(ITA3) – 무어 ARQ 코드에서 파생되었으며 RCA로도 알려져 있다.
ASCII – 유비쿼터스 ASCII 코드는 원래 7비트 문자 집합으로 정의되었다. ASCII 문서는 동등한 표준과 변형의 상세한 세트를 제공한다. 또한 ASCII를 8비트까지 다양하게 확장한다(8비트 이진 코드 참조).
CCIR 476 – 추가 2비트를 체크 숫자로^[4] 사용하여 ITA2를 5비트에서 7비트로 확장
국제 텔레그래프 알파벳 4번(^[4]ITA4)

8비트 이진 코드

확장 ASCII – 다음과 같은 128자를 추가하여 ASCII를 8비트까지 확장하는 여러 표준:
EBCDIC – 초기 IBM 컴퓨터 및 현재 IBM i 및 System z 시스템에서 사용.

10비트 이진 코드

AUTOSPEC – Bauer 코드라고도 한다. AUTOSPEC은 5비트 문자를 두 번 반복하지만 문자가 홀수 패리티를 가지면 반복이 반전된다.^[4]

16비트 이진 코드

UCS-2 – 유니코드의 기본 다국어 평면을 나타낼 수 있는 구식 인코딩

32비트 이진 코드

UTF-32/UCS-4 – 유니코드의 문자당 4바이트 표현

가변 길이 이진 코드

UTF-8 – ASCII와 대부분 호환되는 방식으로 문자를 인코딩하지만 최대 4개의 8비트 바이트 시퀀스로 유니코드 문자의 전체 레퍼토리를 인코딩할 수 있다.
UTF-16 – UCS-2를 확장하여 유니코드 전체를 16비트 요소 하나 또는 두 개의 시퀀스로 포함
GB 18030 – 이전 중국어 멀티바이트 인코딩과의 호환성을 위해 설계된 전체 유니코드 가변 길이 코드
Huffman 코딩 – 덜 일반적인 문자보다 짧은 비트 문자열을 사용하여 더 일반적인 문자를 표현하는 기술

Lempel-Ziv-Welch와 같은 데이터 압축 시스템은 임의의 이진 데이터를 압축할 수 있다. 따라서 바이너리 코드 자체는 아니지만 스토리지 요구를 줄이기 위해 바이너리 코드에 적용할 수 있다.

기타

모스 코드는 가변 길이 텔레파시 코드로, 전통적으로 일련의 길고 짧은 펄스를 사용하여 문자를 인코딩한다. 문자 코드는 "사전 수정 속성"을 가지고 있지 않기 때문에 문자와 단어의 분리를 제공하기 위해 펄스 사이의 간격에 의존한다. 이것은 모스 코드가 반드시 2진법 체계라고는 할 수 없지만, 어떤 의미에서는 "dit" 또는 "dot"의 경우 10, 대시(dash)의 경우 1110, 그리고 단일 분리 단위의 경우 00를 갖는 3진법 체계일 수 있다는 것을 의미한다. Morse 코드는 각 비트가 시간의 한 단위를 나타내도록 허용함으로써 이진 스트림으로 표현될 수 있다. 따라서 "dit" 또는 "dot"은 1비트로, "dah" 또는 "dash"는 3 연속 1비트로 표현된다. 기호, 문자, 단어 사이의 공간은 1개, 3개 또는 7개의 연속 0비트로 표현된다. 예를 들어, Morse Code의 "NO U"는 "—————"로, 이진수로 "1110100011101110111011100000001011101010"으로 나타낼 수 있다. 단, Morse 코드가 ternary 시스템으로 표현되는 경우, "NO U"는 "1110 10 00 1110 1110 00 00 10 10 1110"으로 표현된다.

참고 항목

컴퓨터 문자 집합 목록

참조

^ ^a ^b Alan G. Hobbs (1999-03-05). "Five-unit codes". NADCOMM Museum. Archived from the original on 1999-11-04.
^ ^a ^b Gil Smith (2001). "Teletypewriter Communication Codes" (PDF).
^ "Paper Tape Readers & Punches". The Ferranti Orion Web Site. Archived from the original on 2011-07-21.
^ ^a ^b ^c ^d "Telecipher Devices". John Savard's Home Page.

[Hobbs-1] Alan G. Hobbs (1999-03-05). "Five-unit codes". NADCOMM Museum. Archived from the original on 1999-11-04.

[Smith-2] Gil Smith (2001). "Teletypewriter Communication Codes" (PDF).

[3] "Paper Tape Readers & Punches". The Ferranti Orion Web Site. Archived from the original on 2011-07-21.

[Tele3-4] "Telecipher Devices". John Savard's Home Page.

[1]

[2]

[3]

[4]

Search