왕복형식전환
Round-trip format conversion왕복이라는 용어는 특히 XML과 SGML과 같은 마크업 언어를 포함하는 문서 변환에서 사용된다. 성공적인 왕복은 A형(docA)의 문서를 B형(docB)의 문서로 변환한 다음 다시 A형(docA′)으로 변환하는 것으로 구성된다. docA와 docA′이 동일하다면 정보 손실이 발생하지 않았고 왕복도 성공적이었다. 보다 일반적으로, 그것은 한 데이터 구조에서 다른 데이터 구조로 다시 변환하는 것을 의미한다.
정보손실
한 형식의 문서가 다른 형식으로 변환되면 정보 손실이 발생할 가능성이 높다. 예를 들어 HTML 문서가 일반 텍스트(*.txt)로 저장된다고 가정해 보십시오. 그러면 모든 마크업(구조, 서식, 위첨자 등)이 없어질 것이다. 복합 문서는 이미지 및 기타 내장된 오브젝트에 대한 정보를 자주 잃어버린다. 텍스트 파일을 원래 형식으로 다시 변환하면 정보가 누락될 수밖에 없다.
영상 형식에서도 이와 유사한 효과가 발생한다. JPEG와 같은 일부 형식은 소량의 정보 손실을 통해 압축을 달성한다. BMP나 PNG 파일과 같은 무손실 파일이 JPEG로 변환되었다가 다시 변환되면 결과는 원본과 다를 것이다(시각적으로 매우 유사할 수 있지만).
초기 문서와 최종 문서가 약간 동일하지 않다고 해서 정보 손실이 있는 것은 아니다. 일부 형식에는 정의되지 않은 필드 또는 내용에 따라 결과에 영향을 미치지 않는 필드가 있다.
마크업어군
XML과 같은 마크업 언어는 원칙적으로 어떤 정보도 보유할 수 있으므로 프로세스 docA → docX → docA'는 정보 손실을 피하기 위해 설계될 수 있다. 레거시 포맷은 상호운용성이 더 뛰어나고 사용 가능한 툴 세트가 더 넓기 때문에 이제 XML 포맷으로 변환하는 것이 일반적이다. 따라서 워드 문서를 XML 형식으로 변환하여 다시 가져올 수 있다.
XML 문서는 기존 형식과 동일한 정보를 포함해야 한다. 중요한 조건은 왕복(레거시→XML→레거시)이 사실상 동일한 문서로 귀결되어야 한다는 것이다. 일부 문서 구조는 내용 순서, 공백, 대/소문자 구분 등에서 어느 정도 융통성을 허용하기 때문에, 레거시 형식을 표준화하는 수단을 갖는 것이 유용하다. 전체 왕복 여행은 다음과 같을 수 있다.
- 레거시 → 정식레거시 → XML → 레거시슈 → 정식레거시슈즈
만약 정식 레거시 = 정식 레거시라면 왕복은 성공한 것이다.
캐릭터 인코딩
유니코드는 구형 표준화된 레거시 인코딩과의 왕복 호환성을 갖는 원칙을 가지고 있어, 유니코드로의 문서 변환은 정보를 잃지 않고, 다시 변환할 수 있다. 이를 위해 유니코드 호환성 문자가 도입됐다.
한계
지원서는 왕복이라고 주장할 수 있고 부정직하다. 예를 들어, docX의 필드로 docA의 원본 데이터를 저장할 수 있으므로 docA reverse로의 역변형은 단순히 해당 필드를 추출한다. 경우에 따라서는 이것이 필요할 수도 있지만, 왕복 변환의 아이디어는 다른 형식 표현이나 데이터 구조를 거쳐 다시 되돌아오는 것이다. 이런 전략은 문서의 작은 변경이 다시 원래 형식으로 변환될 수 없다는 것을 의미한다.
사용법
이 용어는 공통적으로 보이지만 사전에는 보고되지 않는다. 일반적인 용어는 [1]에서 발생하지만, 이 용어는 이 전에 사용되었을 가능성이 높다.