데이터 교환 형식
Data Interchange Format이 글은 대부분의 독자들이 이해하기에는 너무 기술적인 것일 수도 있다. (2010년 9월)(이과 시기 |
데이터 교환 형식(.diff)은 스프레드시트 프로그램 간에 단일 스프레드시트를 가져오거나 내보낼 때 사용되는 텍스트 파일 형식이다.
DIF 형식을 여전히 지원하는 애플리케이션은 Collabora Online, *Excel, Gnumeric 및 LibreOffice Calc이다. 수명이 다하거나 포맷 지원을 더 이상 인정하지 않던 과거 애플리케이션은 dBase, FileMaker, Framework, Lotus 1-2-3, Multiplan, OpenOffice.org Calc, StarCalcalcul이다.[1][2]
*일부 구현으로 인해 상호운용성 문제가 발생했으며, 특히 이전 Microsoft Excel 제품의 경우 "구현 구현 감소" 섹션을 참조하십시오.
DIF 형식의 한계는 단일 워크북에서 여러 스프레드시트를 처리할 수 없다는 것이다. 약어와 연령(둘 다 1980년대 초까지의 날짜)의 유사성 때문에 DIF 스프레드시트 형식은 종종 네이비 DIF와 혼동된다. 그러나 네이비 DIF는 워드 프로세서와 무관한 "문서 교환 형식"이다.[3]
역사
DIF는 1980년대 초 Software Arts, Inc.에 의해 개발되었다. 이 명세서는 VisiCalcul의 많은 사본에 포함되었고, 바이트 매거진에 발표되었다. 밥 프랭크스턴은 자신의 비시플롯 프로그램에서 작동할 수 있도록 도와준 미치 카포 등 다른 사람들의 의견을 받아 이 형식을 개발했다. (나중에 카포는 계속해서 로터스를 찾아 로터스 1-2-3을 실현시켰다.) 규격은 1981년 판권이었다.
DIF는 Software Arts Products Corporation(당시 Software Arts의 법적 이름)의 등록 상표였다.
구문
DIF는 모든 것을 ASCII 텍스트 파일에 저장하여 생성 당시 많은 교차 플랫폼 문제를 완화한다. 그러나 최신 스프레드시트 소프트웨어(예: OpenOffice.org Calc 및 Gnumeric)는 내보내기/가져오기 위해 더 많은 문자 인코딩을 제공한다. 파일은 헤더와 데이터의 두 섹션으로 나뉜다. DIF의 모든 것은 2행 또는 3행 청크로 표현된다. 헤더는 3행 청크, 데이터, 2를 얻는다. 헤더 청크는 모두 대문자, 영문자, 32자 미만의 텍스트 식별자로 시작한다. 다음 줄은 숫자 쌍이어야 하며, 세 번째 줄은 따옴표로 묶은 문자열이어야 한다. 반면 데이터 청크는 숫자 쌍으로 시작하고 다음 줄은 따옴표로 묶은 문자열이나 키워드다.
가치
값은 첫 번째 한 쌍의 숫자와 두 번째 한 쌍의 문자열 또는 키워드 중 하나의 두 줄을 차지한다. 쌍의 첫 번째 숫자는 다음과 같은 유형을 나타낸다.
- -1 – 지시 유형, 두 번째 숫자는 무시되며, 다음 행은 다음 키워드 중 하나이다.
- BOT – 튜플 시작(행 시작)
- EOD – 데이터 끝
- 0 – 숫자 유형, 값은 두 번째 숫자, 다음 행은 다음 키워드 중 하나이다.
- V – 유효
- NA – 사용 불가
- 오류 – 오류
- TRUE – True 부울 값
- FALSE – 잘못된 부울 값
- 1 – 문자열 유형, 두 번째 번호는 무시됨, 다음 줄은 큰따옴표로 된 문자열
헤더 청크
헤더 청크는 식별자 선과 값의 두 줄로 구성된다.
- 표 - 버전 뒤에 숫자 값이 표시되고, 사용되지 않는 값의 두 번째 줄에는 제너레이터 설명이 포함됨
- 벡터 - 열 수가 숫자 값으로 따옴
- TUPLES - 행 수가 숫자 값으로 따옴
- DATA - 더미 0 숫자 값 이후, 표에 대한 데이터가 따르고, 각 행에 BOT 값이 선행되며, 전체 테이블이 EOD 값으로 종료됨
헤더 청크의 숫자 값은 유효 키워드 대신 빈 문자열만 사용한다.
구현의 불일치
일부 구현(아마도 이전 마이크로소프트 제품의 구현)은 벡터와 TUPLES의 의미를 바꾸었다. 일부 구현은 헤더에 기록된 표의 치수 오류에 무감각하며 DATA 섹션의 레이아웃을 사용한다.
예
예를 들어, 열 머리글 행이 하나이고 데이터 행이 두 개인 열이 있다고 가정하십시오.
| 텍스트 | 숫자 |
|---|---|
| 안녕 | 1 |
| 텍스트에 "라는 큰따옴표가 있음 | -3 |
.diff 파일에서 이 값은 (→ 코멘트를 나타냄):
표 0.1 "EXCEL" 벡터 → 숫자 값 0.2 → '0'으로 이어지는 열의 수는 숫자 유형임을 나타내며, "TUPLES → '0'은 숫자 값 0,3 → '0'은 숫자 유형, 즉 더미 0 숫자 값 이후 3행이므로 '3'은 숫자 유형임을 나타낸다.e, 표에 대한 데이터는 0.0 → 이것은 지시 형식에 대한 더미 0 숫자 값 "" -1,0 → '-1"이다. 다음은 'BOT' 또는 'EOD' BOT → 셀에 문자열이 포함되어 있으므로 10행 → '1행의 시작을 의미함. (두 번째 번호는 무시함) "텍스트" → 이것은 셀에 문자열이 포함되어 있기 때문에 셀 1,0 → '1'에 있는 문자열이다. "번호" -1,0 BOT → 또 다른 열 1.0 → 문자열이 "hello" 0.1 → 숫자 값('0')을 따르며 '1' V → 'V' 값은 'Valid' -1,0 BOT → 또 다른 열 1,0 "텍스트에 큰따옴표 "0,-3 V -1,0 EOD → 데이터 끝"을 의미한다.
참고 항목
참조
- ^ "LibreOffice Calc – Supported File Formats". LibreOfficeHelp.com. 2020-10-06. Retrieved 2020-09-08.
{{cite web}}: CS1 maint : url-status (링크) - ^ "File formats that are supported in Excel". support.microsoft.com. Retrieved 2021-09-08.
{{cite web}}: CS1 maint : url-status (링크) - ^ 피트로스키, 메리(8월 5일 1985년)."파일 변환 시장 Grows".InfoWorld.Vol7, 안 돼 31일.를 대신하여 서명함. 36–37."파일 포맷 텍스트 파일의 microcomputers 다른 단어 처리 소프트웨어, IBM의 문서 콘텐츠 구조(DCA)과 미국 해군의 문서 교환 형식 실행되는 교환이 용이하도록 설계된 가운데(DIF)가장 위대한 지지를 얻는 것 같다.".
원천
- 제프 월든: 인기 있는 PC 소프트웨어의 파일 형식. 존 와일리 & 선즈 주식회사, 1986. ISBN 0-471-83671-0
- 이 기사의 토론 페이지에 VisiCalculc의 개발자 중 한 명인 Dan Bricklin의 논평
- Commodore 64 데이터 파일, A BASIC 튜토리얼. (1984). 데이비드 밀러. ISBN 0835907910. 212-231페이지.
외부 링크
- Software Arts Products Corp.의 DIF Clearinghouse 발표.