기계 판독 가능 매체 및 데이터
Machine-readable medium and data
통신 및 컴퓨팅에서 기계 판독 가능 매체(machine readable media) 또는 컴퓨터 판독 가능 매체(computer readable media)는 디지털 컴퓨터 또는 기계 장치(mechanical device)가 쉽게 판독할 수 있는 형식으로 데이터를 저장할 수 있는 매체입니다.
그 결과를 기계 판독 가능한 데이터 또는 컴퓨터 판독 가능한 데이터라고 하며, 데이터 자체는 기계 판독 가능성이 있는 것으로 설명할 수 있습니다.
데이터.
컴퓨터에서 읽을 수 있는 데이터는 구조화된 [1]데이터여야 합니다.
기계 판독 가능한 데이터를 생성하려는 시도는 1960년대 초에 발생했습니다.기계 판독과 자연어 처리의 획기적인 발전이 발표되는 동시에(Weizenbaum의 ELIZA와 같은) 사람들은 기계 판독 기능의 성공을 예상하고 기계 판독 가능 문서를 만들려고 시도했습니다.그러한 예로는 음악학자 낸시 B가 있습니다. 라이히는 1966년에 작곡가 윌리엄 제이 시데먼의 작품들을 기계로 읽을 수 있는 카탈로그를 만들었습니다.
미국에서, 2019년 1월 14일의 OPEN Government Data Act는 기계 판독 가능한 데이터를 "의미론적 의미가 손실되지 않도록 보장하면서 인간의 개입 없이 컴퓨터가 쉽게 처리할 수 있는 형식의 데이터"로 정의합니다.이 법률은 미국 연방 기관이 "기관의 모든 공공 데이터 자산이 기계로 [3]읽을 수 있도록" 이러한 [2]방식으로 공공 데이터를 게시하도록 지시합니다.
시스템에서 읽을 수 있는 데이터는 시스템에서도 읽을 수 있도록 표시된 인간이 읽을 수 있는 데이터(예: 마이크로포맷, RDF, HTML)와 시스템에서 주로 처리하기 위한 데이터 파일 형식(CSV, RDF, XML, JSON)의 두 가지 그룹으로 분류할 수 있습니다.이러한 형식은 해당 형식에 포함된 데이터가 공식적으로 구조화된 경우에만 컴퓨터에서 읽을 수 있습니다. 잘못 구성된 스프레드시트에서 CSV 파일을 내보내는 것은 정의를 충족하지 못합니다.
컴퓨터 판독 가능은 디지털로 액세스할 수 있는 것과 동의어가 아닙니다.디지털로 액세스할 수 있는 문서는 온라인 상태일 수 있으므로 사람이 컴퓨터를 통해 쉽게 액세스할 수 있지만, 문서의 내용을 컴퓨터에서 읽을 [4]수 없는 경우 컴퓨터 프로그래밍 논리를 통해 추출, 변환 및 처리하기가 훨씬 어렵습니다.
XML(Extensible Markup Language)은 사람과 기계가 모두 읽을 수 있도록 설계되었으며 XSLT(Extensible Stylesheet Language Transformation)를 사용하여 사람이 읽을 수 있도록 데이터를 표시합니다.예를 들어 XSLT를 사용하여 XML을 PDF(Portable Document Format)로 자동 렌더링할 수 있습니다.기계 판독 가능 데이터는 사람이 판독할 수 있도록 자동으로 변환될 수 있지만, 일반적으로 그 반대는 아닙니다.
GPR(Government Performance and Results Act) 현대화법(GPRA)의 시행을 위해, OMB(Office of Management and Budget)는 다음과 같이 정의합니다. "웹 브라우저 또는 컴퓨터 시스템에서 자동으로 읽을 수 있는 표준 컴퓨터 언어(영어 텍스트가 아님)로 포맷합니다.(예: xml).기존의 워드 프로세싱 문서와 휴대용 문서 형식(PDF) 파일은 사람이 쉽게 읽을 수 있지만 일반적으로 기계가 해석하기는 어렵습니다.확장 가능 마크업 언어(XML), (JSON) 또는 CSV(쉼표로 구분된 값)로 내보낼 수 있는 헤더 열이 있는 스프레드시트와 같은 다른 형식은 컴퓨터에서 읽을 수 있는 형식입니다.HTML은 구조적 마크업 언어로서 문서의 일부에 조심스럽게 라벨을 붙이기 때문에, 컴퓨터는 목차, 개요, 문헌 검색 목록 등을 조립하기 위해 문서 구성요소를 모을 수 있습니다.전통적인 워드 프로세싱 문서 및 기타 형식을 기계로 읽을 수 있도록 하는 것은 가능하지만 문서에는 향상된 구조 [5]요소가 포함되어야 합니다."
미디어
기계 판독 가능 미디어의 예로는 자기 디스크, 카드, 테이프 및 드럼과 같은 자기 미디어, 천공 카드 및 종이 테이프, 광 디스크, 바코드 및 자기 잉크 문자가 있습니다.
일반적인 기계 판독 기술에는 자기 기록, 파형 처리 및 바코드가 포함됩니다.광학 문자 인식(OCR)을 사용하여 기계가 인간이 사용할 수 있는 정보를 읽을 수 있습니다.어떤 형태의 에너지로도 검색할 수 있는 모든 정보는 기계 판독이 가능합니다.
예를 들어 다음과 같습니다.
적용들
문서.
카탈로그
사전
MRD(기계 판독 가능 사전)는 종이에 인쇄되는 대신 기계 판독 가능 데이터로 저장되는 사전입니다.그것은 전자 사전과 어휘 데이터베이스입니다.
컴퓨터로 읽을 수 있는 사전은 데이터베이스에 로드할 수 있고 응용 프로그램 소프트웨어를 통해 쿼리할 수 있는 전자 형식의 사전입니다.두 개 이상의 언어 간 번역을 지원하기 위한 단일 언어 설명 사전 또는 다국어 사전이거나 둘 다의 조합일 수 있습니다.여러 언어 간의 번역 소프트웨어는 일반적으로 양방향 사전을 적용합니다.MRD는 전용 소프트웨어(예: 인터넷을 통해 온라인)에 의해 쿼리되는 독점 구조의 사전이거나 개방형 구조의 사전일 수 있으며 컴퓨터 데이터베이스에서 로드할 수 있으므로 다양한 소프트웨어 응용 프로그램을 통해 사용할 수 있습니다.기존 사전에는 다양한 설명이 포함된 부제가 포함되어 있습니다.컴퓨터로 읽을 수 있는 사전에는 추가 기능이 있을 수 있으므로 스마트 사전이라고도 합니다.스마트 사전의 예로는 오픈 소스 겔리쉬 영어 사전이 있습니다.
사전이라는 용어는 철자 검사기에서 예를 들어 사용되는 전자 어휘 또는 어휘를 가리키는 데도 사용됩니다.사전이 개념(또는 용어)의 하위 유형-슈퍼 유형 계층 구조로 배열된 경우 이를 분류법이라고 합니다.개념 간의 다른 관계도 포함하는 경우 온톨로지라고 합니다.검색 엔진은 검색 결과를 최적화하기 위해 어휘, 분류법 또는 온톨로지를 사용할 수 있습니다.전문화된 전자 사전은 형태학 사전 또는 통사 사전입니다.
여권
MRP(기계 판독 가능 여권)는 ID 페이지의 데이터가 광학 문자 인식 형식으로 인코딩된 기계 판독 가능 여행 문서(MRTD)입니다.많은 나라들이 1980년대에 기계로 읽을 수 있는 여행 문서를 발행하기 시작했습니다.
전 세계 대부분의 여행 여권은 MRP입니다.ICAO 문서 9303(국제 표준화 기구 및 국제 전기 위원회에서 ISO/IEC 7501-1로 승인)에 의해 표준화되며, 일반적으로 여권 시작 부분의 ID 페이지 하단에 있는 특수 기계 판독 가능 영역(MRZ)이 있습니다.ICAO 9303에는 ISO/IEC 7810 크기에 해당하는 세 가지 유형의 문서가 설명되어 있습니다.
- "타입 3"은 전형적인 여권 책자입니다.MRZ는 2줄 x 44자로 구성됩니다.
- "타입 2"는 2줄 x 36자로 비교적 희귀합니다.
- "타입 1"은 3줄 x 30자의 신용카드 크기입니다.
고정 형식을 사용하면 문서 유형, 이름, 문서 번호, 국적, 생년월일, 성별 및 문서 만료 날짜를 지정할 수 있습니다.이 모든 필드는 여권에 필요합니다.종종 국가에 의존하는 선택적인 보충 정보를 위한 여지가 있습니다.또한 두 가지 크기의 기계 판독 가능 비자가 유사하게 정의되어 있습니다.
카메라와 적합한 소프트웨어가 있는 컴퓨터는 기계로 읽을 수 있는 여권의 정보를 직접 읽을 수 있습니다.이를 통해 출입국 관리 직원이 도착 승객을 더 빨리 처리할 수 있을 뿐만 아니라 수동으로 읽은 여권보다 더 정확하고, 더 많은 데이터 입력, 더 많은 데이터 및 출입국 데이터베이스 및 감시 목록에 대한 더 나은 데이터 일치가 가능합니다.
광학적으로 읽을 수 있는 정보 외에도, 많은 여권에는 휴대용 사진과 같은 더 많은 양의 정보를 컴퓨터가 읽을 수 있게 해주는 RFID 칩이 포함되어 있습니다.이러한 여권은 생체 인식 여권이라고 하며 ICAO 9303에서도 설명합니다.참고 항목

레퍼런스
- ^ "Machine readable". opendatahandbook.org. Retrieved 2019-07-22.
- ^ "HR4174". stratml.us.
- ^ "HR4174". stratml.us.
- ^ Hendler, Jim; Pardo, Theresa A. (2012-09-24). "A Primer on Machine Readability for Online Documents and Data". Data.gov. Retrieved 2015-02-27.
- ^ OMB Circular A-11, Part 6 웨이백 머신에서 2020-04-22 보관, 예산 준비, 제출 및 집행
- ^ Gil Francopoulo (편집) LMF 어휘 마크업 프레임워크, ISTE / Wiley 2013 (ISBN 978-1-84821-430-9)
이 문서에는 다음의 퍼블릭 도메인 자료가 포함되어 있습니다.