탭 구분 값

Tab-separated values
탭 구분 값
파일 이름 확장자.tsv,.tab
인터넷 미디어 유형
텍스트/탭 구분값
포맷의 종류멀티플랫폼, 시리얼 데이터 스트림
컨테이너:필드 구분 목록으로 구성된 데이터베이스 정보
표준.IANA MIME 유형

탭 구분값(TSV) 파일은 데이터베이스 테이블 또는 스프레드시트 [1]데이터 등의 표 구조 [2]및 데이터베이스 에 정보를 교환하는 방법으로 데이터를 저장하기 위한 단순한 텍스트 형식입니다.표의 각 레코드는 텍스트 파일의 한 줄입니다.레코드의 각 필드 값은 탭 문자로 다음 필드 값과 구분된다.따라서 TSV 형식은 쉼표로 구분된 값 형식의 변형입니다.

TSV는 널리 지원되는 단순한 파일 형식이기 때문에 데이터 교환에서 이 형식을 지원하는 서로 다른 컴퓨터 프로그램 간에 테이블 형식의 데이터를 이동하는 데 자주 사용됩니다.예를 들어 TSV 파일을 사용하여 데이터베이스 프로그램에서 스프레드시트로 정보를 전송할 수 있습니다.

TSV의[2] IANA 표준은 필드 내에서 탭을 허용하지 않음으로써 단순함을 실현합니다.

Iris데이터 세트의 헤드는 다음 일반 텍스트를 사용하여 TSV로 저장할 수 있습니다(HTML 렌더링에서는 탭을 공백으로 변환할 수 있습니다).

세팔 길이 세팔 길이 꽃잎 길이 5.1 3.5 1.4 0.2 I. setosa 4.9 3.0 1.4 0.2 I. setosa 4.7 3.2 1.2 1.2 I. setosa 4.6 3.1 1.5 0.2 I. setosa 5.0 I.

위의 TSV 플레인텍스트는 다음 표 형식의 데이터에 대응합니다.

세팔 길이 세팔 폭 꽃잎 길이 꽃잎 폭 종.
5.1 3.5 1.4 0.2 세토사
4.9 3.0 1.4 0.2 세토사
4.7 3.2 1.3 0.2 세토사
4.6 3.1 1.5 0.2 세토사
5.0 3.6 1.4 0.2 세토사

TSV로의 무손실 변환 규약

TSV 형식의 값에는 리터럴탭이나 줄바꿈 문자를 포함할 수 없기 때문에 이러한 문자를 사용한 텍스트 값의 무손실 변환에는 규칙이 필요합니다.일반적인 규칙은 다음과 같은 [3][4]탈출을 수행하는 것입니다.

\n은 줄바꿈, \t는 탭, \r은 캐리지 리턴, \\는 백슬래시입니다. 

또 하나의 일반적인 표기법은 CSV 표기법을 사용하는 것입니다. RFC4180 및 이러한 특수문자는 큰따옴표로 묶습니다.이것은 애매모호한 것으로 이어질 수 있습니다.

또 하나의 애매한 점은 UNIX의 회선에서는 일반적인 것처럼 레코드가 줄바꿈으로 구분되어 있는지, Microsoft 플랫폼에서는 일반적인 줄바꿈에 이은 줄바꿈으로 구분되어 있는지 여부입니다.LibreOffice와 같은 많은 프로그램들은 마차가 돌아오고 새로운 노선이 올 것으로 예상한다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ 국제통화기금(IMF)이 발행하는 TSV(Tab Separated Value) 파일 사용방법
  2. ^ a b "Definition of tab-separated-values (tsv)". Internet Assigned Numbers Authority (IANA).
  3. ^ "Linear TSV". Data Protocols - Open Knowledge Foundation.
  4. ^ "jq Manual". stedolan.github.io.

참고 문헌

외부 링크