탭 구분 값
Tab-separated values| 파일 이름 확장자 | .tsv,.tab |
|---|---|
| 인터넷 미디어 유형 | 텍스트/탭 구분값 |
| 포맷의 종류 | 멀티플랫폼, 시리얼 데이터 스트림 |
| 컨테이너: | 필드 구분 목록으로 구성된 데이터베이스 정보 |
| 표준. | IANA MIME 유형 |
탭 구분값(TSV) 파일은 데이터베이스 테이블 또는 스프레드시트 [1]데이터 등의 표 구조 [2]및 데이터베이스 간에 정보를 교환하는 방법으로 데이터를 저장하기 위한 단순한 텍스트 형식입니다.표의 각 레코드는 텍스트 파일의 한 줄입니다.레코드의 각 필드 값은 탭 문자로 다음 필드 값과 구분된다.따라서 TSV 형식은 쉼표로 구분된 값 형식의 변형입니다.
TSV는 널리 지원되는 단순한 파일 형식이기 때문에 데이터 교환에서 이 형식을 지원하는 서로 다른 컴퓨터 프로그램 간에 테이블 형식의 데이터를 이동하는 데 자주 사용됩니다.예를 들어 TSV 파일을 사용하여 데이터베이스 프로그램에서 스프레드시트로 정보를 전송할 수 있습니다.
TSV의[2] IANA 표준은 필드 내에서 탭을 허용하지 않음으로써 단순함을 실현합니다.
예
Iris 꽃 데이터 세트의 헤드는 다음 일반 텍스트를 사용하여 TSV로 저장할 수 있습니다(HTML 렌더링에서는 탭을 공백으로 변환할 수 있습니다).
세팔 길이 세팔 길이 꽃잎 길이 5.1 3.5 1.4 0.2 I. setosa 4.9 3.0 1.4 0.2 I. setosa 4.7 3.2 1.2 1.2 I. setosa 4.6 3.1 1.5 0.2 I. setosa 5.0 I.
위의 TSV 플레인텍스트는 다음 표 형식의 데이터에 대응합니다.
| 세팔 길이 | 세팔 폭 | 꽃잎 길이 | 꽃잎 폭 | 종. |
|---|---|---|---|---|
| 5.1 | 3.5 | 1.4 | 0.2 | 세토사 |
| 4.9 | 3.0 | 1.4 | 0.2 | 세토사 |
| 4.7 | 3.2 | 1.3 | 0.2 | 세토사 |
| 4.6 | 3.1 | 1.5 | 0.2 | 세토사 |
| 5.0 | 3.6 | 1.4 | 0.2 | 세토사 |
TSV로의 무손실 변환 규약
TSV 형식의 값에는 리터럴탭이나 줄바꿈 문자를 포함할 수 없기 때문에 이러한 문자를 사용한 텍스트 값의 무손실 변환에는 규칙이 필요합니다.일반적인 규칙은 다음과 같은 [3][4]탈출을 수행하는 것입니다.
\n은 줄바꿈, \t는 탭, \r은 캐리지 리턴, \\는 백슬래시입니다.
또 하나의 일반적인 표기법은 CSV 표기법을 사용하는 것입니다. RFC4180 및 이러한 특수문자는 큰따옴표로 묶습니다.이것은 애매모호한 것으로 이어질 수 있습니다.
또 하나의 애매한 점은 UNIX의 회선에서는 일반적인 것처럼 레코드가 줄바꿈으로 구분되어 있는지, Microsoft 플랫폼에서는 일반적인 줄바꿈에 이은 줄바꿈으로 구분되어 있는지 여부입니다.LibreOffice와 같은 많은 프로그램들은 마차가 돌아오고 새로운 노선이 올 것으로 예상한다.
「 」를 참조해 주세요.
레퍼런스
- ^ 국제통화기금(IMF)이 발행하는 TSV(Tab Separated Value) 파일 사용방법
- ^ a b "Definition of tab-separated-values (tsv)". Internet Assigned Numbers Authority (IANA).
- ^ "Linear TSV". Data Protocols - Open Knowledge Foundation.
- ^ "jq Manual". stedolan.github.io.
참고 문헌
- IANA, Text Media Types, 탭 구분값의 정의(tsv), Paul Lindner, MN Internet Gopher Team, 1993년 6월
- TSV(Tab Separated Values): 표 형식의 데이터 교환 형식, Juka Korpela, 2000-09-01, 최종 업데이트 2005-02-12.