번역 메모리

Translation memory

번역 메모리(TM)는 번역자를 지원하기 위해 이전에 번역된 문장, 단락 또는 문장과 같은 단위(목록의 제목, 제목 또는 요소)를 포함할 수 있는 "세그먼트"를 저장하는 데이터베이스입니다.번역 메모리는 원본 텍스트와 이에 대응하는 번역을 "번역 단위"라고 불리는 언어 쌍으로 저장합니다.개별 단어는 용어 베이스로 처리되며 TM의 영역에 속하지 않습니다.

번역 메모리를 사용하는 소프트웨어 프로그램은 번역 메모리 매니저(TMM) 또는 번역 메모리 시스템(TM 시스템)이라고 불리기도 합니다.번역 관리 시스템(TMS)과 혼동하지 마십시오.번역 관리 시스템(Translation Management System, TMS)은 번역 프로세스 관리에 중점을 둔 또 다른 유형의 소프트웨어입니다.

번역 메모리는 일반적으로 전용 컴퓨터 지원 번역(CAT) 도구, 워드 프로세싱 프로그램, 용어 관리 시스템, 다국어 사전 또는 원시 기계 번역 출력과 함께 사용됩니다.

조사에 따르면 다국어 문서를 작성하는 많은 기업이 번역 메모리 시스템을 사용하고 있습니다.2006년의 어학 전문가에 대한 조사에서는, 874건의 회답 중 82.5%가 [1]TM 의 사용을 확인했습니다.기술 용어 및 간단한 문장 구조(기술적, 마케팅 및 재무적 수준보다 낮음), 컴퓨팅 기술 및 [1]콘텐츠의 반복성으로 특징지어지는 텍스트 유형과 관련된 TM의 사용.

번역 메모리 사용

이 프로그램은 소스 텍스트(번역할 텍스트)를 세그먼트(segment)로 분할하여 번역 메모리에 저장되어 있는 이전에 변환된 소스-타깃 쌍의 소스 절반과 세그먼트 간의 일치를 검색하여 번역 풀 또는 부분 일치와 같은 일치 쌍을 표시합니다.번역자는 일치를 받아들이거나 새로운 번역으로 대체하거나 발신원과 일치하도록 수정할 수 있습니다.마지막 2가지 경우 신규 변환 또는 변경된 변환이 데이터베이스에 들어갑니다.

일부 번역 메모리 시스템은 100% 일치만을 검색합니다.즉, 데이터베이스 내의 엔트리와 정확히 일치하는 텍스트 세그먼트만 검색할 수 있습니다.또 다른 번역 메모리 시스템은 퍼지 일치 알고리즘을 사용하여 유사한 세그먼트를 검색하며, 이러한 세그먼트는 차이에 따라 번역자에게 제시됩니다.일반적인 번역 메모리 시스템은 소스 세그먼트에서만 텍스트를 검색한다는 점에 유의하십시오.

매칭 알고리즘의 유연성과 견고성에 따라서는 번역 메모리의 퍼포먼스가 크게 결정됩니다.단, 일부 어플리케이션에서는 100% 일치 접근방식을 정당화할 수 있을 정도로 정확한 매칭 회수율이 높을 수 있습니다.

일치하지 않는 세그먼트는 번역자가 수동으로 번역해야 합니다.새로 번역된 세그먼트는 데이터베이스에 저장되어 향후 번역 및 현재 텍스트에서 해당 세그먼트의 반복에 사용할 수 있습니다.

번역 메모리는 기술 매뉴얼 등 반복성이 높은 텍스트에 가장 적합합니다.또한 이전에 번역된 문서의 증분 변경 사항을 번역할 때도 유용합니다. 예를 들어, 사용자 설명서의 새 버전의 사소한 변경 사항에 해당합니다.전통적으로 번역기억은 사용되는 언어에서 반복이 매우 적다는 단순한 이유 때문에 문학이나 창조적인 텍스트에 적합하지 않다고 여겨져 왔다.단, 작성된 데이터베이스 리소스는 용어의 적절한 사용법, 품질보증(빈 세그먼트 없음) 및 리뷰 프로세스의 심플화(원본과 타깃 세그먼트는 번역자가 사용할 때 항상 함께 표시됨)를 위한 가치가 있기 때문에 반복되지 않는 텍스트에서도 가치가 있다고 생각하는 사람도 있습니다.기존 검토 환경에서 두 개의 문서를 사용하여 작업합니다.)

주요 장점

번역 메모리 매니저는 기술 문서 및 전문 용어를 포함하는 문서를 번역하는 데 가장 적합합니다.다음과 같은 이점이 있습니다.

  • 문서가 완전히 번역되었는지 확인(번역 메모리는 빈 타깃 세그먼트를 허용하지 않음)
  • 공통의 정의, 표현, 용어 등 번역된 문서의 일관성을 확보합니다.이것은, 다른 번역자가 1개의 프로젝트에 임하고 있는 경우에 중요합니다.
  • 번역자는 일반적으로 이러한 포맷을 처리하기 위해 필요한 소프트웨어를 소유할 필요 없이 다양한 포맷으로 문서를 번역할 수 있습니다.
  • 번역 메모리는 이전에 번역된 자료를 '기억'하기 때문에 번역자는 한 번만 번역하면 됩니다.
  • 장기 번역 프로젝트 비용 절감.예를 들어 매뉴얼, 경고 메시지 또는 일련의 문서를 한 번만 번역하면 여러 번 사용할 수 있습니다.
  • 대규모 문서 프로젝트의 경우, TM 패키지를 사용한 경우, 새로운 프로젝트의 첫 번역을 실시해도 (시간 또는 비용) 절약은 명백할 수 있지만, 일반적으로 이러한 절약은 번역 메모리를 사용하기 전에 번역된 프로젝트의 후속 버전을 번역하는 경우에만 명확해집니다.

주요 장애물

번역 메모리 매니저의 광범위한 사용을 방해하는 주요 문제는 다음과 같습니다.

  • '번역 메모리'의 개념은 이전 번역에서 사용된 문장을 '재순환'할 수 있다는 전제를 바탕으로 합니다.그러나 번역의 기본 원칙은 번역자가 텍스트의 메시지를 번역해야 하며, 텍스트의 구성 문장은 번역하지 않아야 한다는 것입니다.
  • 번역 메모리 매니저는 기존 번역 또는 현지화 프로세스에 쉽게 적합하지 않습니다.TM 테크놀로지를 활용하려면 번역 프로세스를 재설계해야 합니다.
  • 현재 번역 메모리 매니저가 모든 문서 형식을 지원하는 것은 아닙니다.또한 일부 파일 형식을 지원하는 필터는 존재하지 않을 수 있습니다.
  • 번역 메모리 매니저의 사용에는 학습 곡선이 있으며, 프로그램을 최대한 효과적으로 커스터마이즈해야 합니다.
  • 번역 프로세스의 전부 또는 일부가 오프사이트에서 일하는 프리랜서 번역자에 의해 아웃소싱되거나 처리되는 경우, 오프사이트 작업자는 번역 메모리 매니저에 의해 생성된 텍스트를 조작할 수 있는 특별한 도구를 필요로 합니다.
  • 많은 번역 메모리 매니저의 풀 버전은 시트당 US$500에서 US$2,500의 비용이 들 수 있습니다.이는 상당한 투자를 의미할 수 있습니다(단, 저비용 프로그램도 이용할 수 있습니다).그러나 일부 개발자는 개별 번역자가 풀버전의 툴을 셋업한 프로젝트에 사용할 수 있는 기능 세트를 줄인 툴의 무료 버전 또는 저가 버전을 제작하고 있습니다(프리웨어 및 쉐어웨어 TM 패키지는 있지만 아직 큰 시장 점유율을 얻지 못했습니다).
  • 사용자의 과거 번역을 번역 메모리 데이터베이스, 트레이닝 및 애드온 제품에 Import하는 데 드는 비용도 상당한 투자를 의미할 수 있습니다.
  • 대부분의 경우 번역 메모리 데이터베이스의 유지보수는 여전히 수동 프로세스이기 때문에 유지보수를 하지 않으면 TM의 조작성과 품질이 크게 저하될 수 있습니다.
  • 앞에서 설명한 바와 같이 번역 메모리 매니저는 내부 반복이 없거나 리비전 사이에 변경되지 않은 부분이 없는 텍스트에는 적합하지 않을 수 있습니다.일반적으로 번역 메모리에는 테크니컬 텍스트가 가장 적합하지만 마케팅이나 크리에이티브 텍스트는 적합하지 않습니다.

품질에 미치는 영향

TM 시스템을 사용하면 번역된 텍스트의 품질에 영향을 미칠 수 있습니다.그 주된 영향은, 이른바 「오류 전파」와 관련하고 있습니다.특정 세그먼트의 번역이 올바르지 않은 경우, 실제로는 다음에 같은 소스 텍스트 또는 유사한 소스 텍스트가 번역되었을 때 잘못된 번역이 재사용되어 에러가 계속 발생할 가능성이 높아집니다.전통적으로 번역본의 품질에 대한 두 가지 주요 효과, 즉 "문장-샐러드" 효과(Bédard 2000, O'Hagan 2009: 50에서 인용)와 "피프홀" 효과(Heyn 1998)가 설명되었다.첫 번째는 TM의 문장을 사용하여 텍스트를 번역할 때 텍스트 수준에서 일관성이 결여된 것을 말합니다.이 문장들은 다른 스타일의 번역자들에 의해 번역되었습니다.후자에 따르면 번역자는 TM 시스템 사용에 맞게 스타일을 조정할 수 있으며, 이는 번역자가 텍스트 내에서 참조를 포함하지 않도록 함으로써 세그먼트를 향후 텍스트에서 더 잘 재사용할 수 있으며, 그 결과 응집성과 가독성에 영향을 미칠 수 있다(O'Hagan 2009).

번역된 텍스트에 잠재력이 있고, 존재하는 경우 무의식적인 영향이 있을 수 있습니다.언어마다 문장 내의 논리 요소에 다른 시퀀스를 사용하고, 번역자는 반쯤 번역된 복수절 문장을 사용하여 문장을 완전히 재구축할 가능성은 낮습니다.일관된 경험적 증거(Martin-Mor 2011)에 따르면 번역자는 TM 시스템이 아닌 텍스트 프로세서를 사용하여 작업할 때 다중 절 문장의 구조를 수정할 가능성이 높다.

또한 번역자가 각각의 문장이 주변 사람들과 텍스트 전체에 어떻게 관련되어 있는지에 초점을 맞추는 대신 한 문장 한 문장씩 기계적으로 텍스트를 다룰 수 있는 가능성이 있습니다.연구자(Dragsted 2004)는 이러한 프로그램의 자동 분할 기능과 관련된 이 효과를 확인했지만 번역 품질에 반드시 부정적인 영향을 미치는 것은 아닙니다.

이러한 효과는 툴 고유의 것이 아니라 훈련과 밀접하게 관련되어 있습니다.Martin-Mor(2011)에 따르면 TM 시스템의 사용은 번역문 품질에 영향을 미치지만, 경험이 풍부한 번역자는 이를 피할 수 있다.Pym(2013)은 "TM/MT를 사용하는 번역자는 진행하면서 각 세그먼트를 수정하는 경향이 있으며, 마지막에 전체 텍스트를 최종 수정하는 데 시간이 거의 없다"고 상기시킨다. 이는 실제로 여기에 설명된 효과의 일부의 궁극적인 원인일 수 있다.

번역 메모리 시스템 유형

  • 데스크톱:데스크톱 번역 메모리 도구는 보통 번역자가 번역을 완료하기 위해 사용하는 도구입니다.프리랜서 번역자가 다운로드하여 데스크톱 컴퓨터에 설치하는 프로그램입니다.
  • 서버 기반 또는 집중 관리:집중형 번역 메모리 시스템은 TM을 중앙 서버에 저장합니다.데스크톱 TM과 연계하여 TM의 일치율을 데스크톱 TM만의 활용률보다 30~60% 높일 수 있습니다.

기능들

다음은 번역 메모리의 주요 기능을 정리한 것입니다.

오프라인 기능

수입품

이 기능은 텍스트 파일에서 TM으로 텍스트와 해당 번역을 전송하는 데 사용됩니다.Import는 raw 형식에서 실행할 수 있습니다.이 형식에서는 외부 소스 텍스트를 번역과 함께 TM으로 Import할 수 있습니다.사용자가 텍스트를 재처리해야 하는 경우도 있습니다.Import에 사용할 수 있는 다른 형식은 네이티브 형식입니다.이 포맷은 TM을 사용하여 번역 메모리를 파일에 저장하는 포맷입니다.

분석.

분석 프로세스에는 다음 단계가 포함됩니다.

텍스트 해석
예를 들어 문장 끝의 마침표와 약어의 마침표를 구별하기 위해서는 구두점을 올바르게 인식하는 것이 매우 중요합니다.그래서 마크업은 일종의 사전 편집이다.번역 단계는 다국어 문서 제작 라인에 포함되어 있기 때문에 통상 번역자 지원 프로그램을 통해 처리된 자료에는 마크업이 포함되어 있습니다.기타 특수 텍스트 요소는 마크업에 의해 상쇄될 수 있습니다.고유 이름이나 코드 등 번역할 필요가 없는 특수한 요소가 있는 반면 다른 요소는 네이티브 형식으로 변환해야 할 수 있습니다.
언어 해석
기본 양식 축소는 단어 목록과 용어 자동 검색을 위한 텍스트를 작성하는 데 사용됩니다.한편 구문 해석은 소스 텍스트에서 여러 단어 용어 또는 구문을 추출하기 위해 사용될 수 있다.구문 분석은 어순의 변화를 정규화하기 위해 사용되며, 이것이 어구를 형성할 수 있는 단어입니다.
세그멘테이션
그 목적은 가장 유용한 번역 단위를 선택하는 것입니다.분할은 구문 분석의 한 종류와 같습니다.표피적 해석을 사용하여 단일 언어로 수행되며 정렬은 분할을 기반으로 합니다.번역자가 수동으로 세그먼테이션을 수정하는 경우, 프로그램의 에러가 반복되기 때문에, 이 문서의 새로운 버전은 수정된 세그먼트화에 근거해 TM과의 일치를 찾을 수 없습니다.번역자는 보통 한 문장씩 진행되지만, 한 문장의 번역은 주변 문장의 번역에 따라 달라질 수 있습니다.
얼라인먼트
이것은 소스 텍스트와 타깃 텍스트 간의 번역 대응 관계를 정의하는 작업입니다.정렬에서 분할까지 피드백이 있어야 하며, 적절한 정렬 알고리즘이 초기 분할을 수정할 수 있어야 합니다.
용어 추출
이전 사전을 입력으로 사용할 수 있습니다.또한 알 수 없는 용어를 추출할 때 텍스트 통계를 기반으로 구문 분석을 사용할 수 있습니다.번역 작업에 필요한 작업량을 견적하기 위해 사용됩니다.이것은 작업을 계획하고 스케줄 할 때 매우 유용합니다.번역 통계는 보통 단어를 세고 텍스트의 반복 횟수를 추정합니다.

내보내기

Export는 TM에서 외부 텍스트 파일로 텍스트를 전송합니다.Import와 export는 반대로 해야 합니다.

온라인 기능

번역 시 TM의 주요 목적 중 하나는 메모리 내에서 가장 유용한 일치를 가져와 번역자가 최적의 일치를 선택할 수 있도록 하는 것입니다.TM은 식별성과 차이를 나타내는 원본 텍스트와 대상 텍스트를 모두 보여줘야 합니다.

취득

TM에서 몇 가지 다른 유형의 일치 항목을 검색할 수 있습니다.

완전 일치
현재 소스 세그먼트와 저장된 세그먼트 간의 일치가 문자별 일치일 경우 정확한 일치가 표시됩니다.문장을 번역할 때, 정확히 일치하는 것은 같은 문장이 이전에 번역된 적이 있다는 것을 의미합니다.정확한 일치는 "100% 일치"라고도 합니다.
컨텍스트 내 정확도(ICE) 일치 또는 보증 일치
ICE 일치란 정확히 동일한 컨텍스트, 즉 문단의 동일한 위치에서 발생하는 정확한 일치입니다.컨텍스트는 대부분의 경우 문서 파일 이름, 날짜 및 권한과 같은 주변 문장과 속성에 의해 정의됩니다.
퍼지 매치
정확하지 않은 매치는 퍼지 매치입니다.일부 시스템에서는 이러한 종류의 일치에 백분율을 할당합니다. 이 경우 퍼지 일치가 0% 이상 100% 미만입니다.이러한 수치는 채점 방법이 명시되지 않는 한 시스템 간에 비교할 수 없다.
콩코드
변환자가 소스 세그먼트에서 하나 이상의 단어를 선택하면 시스템은 검색 기준과 일치하는 세그먼트 쌍을 가져옵니다.이 기능은 용어 데이터베이스가 없는 경우 용어 및 관용어 번역 검색에 도움이 됩니다.

업데이트 중

TM은 번역자가 승인하면 새로운 번역으로 갱신됩니다.데이터베이스를 업데이트할 때 항상 그렇듯이 데이터베이스의 이전 내용을 어떻게 해야 할지 의문이 있습니다.TM은 TM의 항목을 변경하거나 삭제하여 수정할 수 있습니다.일부 시스템에서는 번역자가 같은 소스 세그먼트의 여러 번 번 번역을 저장할 수 있습니다.

자동 번역

번역 메모리 툴은 자동 검색 및 대체 기능을 제공하는 경우가 많습니다.

자동 검색
번역자가 문서를 이동할 때 TM 시스템이 검색되고 결과가 자동으로 표시됩니다.
자동 대체
자동 치환을 사용하면 문서의 새 버전을 번역할 때 정확히 일치하는 항목이 발견되면 소프트웨어는 이전 번역을 반복합니다.번역자가 번역을 원본과 대조하지 않으면 이전 번역의 오류가 반복됩니다.

네트워킹

한 번역자가 번역한 문장과 구문을 다른 번역자가 사용할 수 있기 때문에 네트워킹을 통해 번역자 그룹은 각자 단독으로 작업하는 경우보다 빠르게 텍스트를 번역할 수 있습니다.또한 최종 번역 전에 번역 메모리를 공유하면 한 번역자의 실수가 다른 팀원에 의해 수정될 수 있습니다.

텍스트 메모리

"텍스트 메모리"는 제안된 Lisa OSCAR xml:tm 표준의 기초입니다.텍스트 메모리는 작성자 메모리와 번역 메모리로 구성됩니다.

번역 메모리

번역 중에 고유 식별자가 기억되므로 대상 언어 문서는 텍스트 단위 수준에서 '정확하게' 정렬됩니다.그 후 원본 문서가 변경되면 변경되지 않은 텍스트 단위를 번역자가 개입할 필요 없이 문서의 새로운 대상 버전으로 직접 전송할 수 있습니다.이것은 번역 메모리에 '정확한' 또는 '완벽한'을 매칭하는 개념입니다.xml:tm은 또한 내부 활용 및 퍼지 매칭을 위한 메커니즘을 제공할 수 있습니다.

역사

1970년대는 TM 시스템의 초기 단계이며, 학자들이 예비 탐색 논의를 진행했습니다.TM 시스템에 대한 원래 아이디어는 종종 Martin Kay의 "Properate Place"[2] 논문에서 기인하지만[according to whom?], 자세한 내용은 제공되지 않습니다.이 문서에서는 스토리지 시스템의 기본 개념을 설명했습니다.「번역자는, 커맨드를 발행하는 것으로부터 개시할 가능성이 있습니다.이것에 의해, 시스템은 스토어에 관련하는 모든 것을 표시할 수 있습니다.진행하기 전에 유사한 내용을 포함하는 텍스트의 과거와 미래의 조각을 검토할 수 있습니다."Kay의 이러한 견해는 실제로 번역자가 이미 번역된 유사한 문서를 온라인에서 사용할 수 있다는 Peter Arthern의 제안에 영향을 받았습니다.1978년 기사에서 그는 오늘날 TM 시스템이라고 불리는 것을 완전히 시연했습니다.새로운 텍스트는 워드프로세서 스테이션에 입력되며, 타이핑되는 동안 시스템은 이 텍스트를 메모리에 저장된 이전 텍스트와 대조하여 다른 모든 공식 언어로 번역합니다.적절한 기계번역보다 한 가지 장점은 이렇게 검색된 모든 구절이 문법적으로 정확하다는 것입니다.사실상 우리는 전자적인 '컷 앤 스틱' 프로세스를 운영해야 합니다.그러면 현재 번역자들이 번역 작업을 효과적으로 수행하기 위해 사용하는 시간의 최소 15%를 절약할 수 있습니다.

이 아이디어는 ALPS(Automated Language Processing Systems)에서 도입되었습니다.툴은 브리검영대학교의 연구자에 의해 처음 개발되었으며, 당시 TM 시스템의 아이디어는 일치하는 문자열을 찾는 것을 목적으로 하는 "Repetitions Processing"이라는 툴과 혼합되어 있었습니다.오랜 시간이 흐른 뒤에야 이른바 번역기억이라는 개념이 생겨났다.

TM 시스템의 실제 탐색 단계는 1980년대입니다.TM 시스템의 최초 구현 중 하나는 Sadler and Vendelmans의 2개 국어 지식 뱅크에 소개되었습니다.2개 국어 지식 은행은 구문 및 참조 구조화된 말뭉치입니다.한쪽은 다른쪽의 번역입니다.번역 유닛은 말뭉치 간에 교차 코딩됩니다.2개 국어 지식 은행의 목적은 기계 번역 및 컴퓨터 지원 번역 애플리케이션을 위한 말뭉치 기반의 범용 지식 소스를 개발하는 것이다(Sadler & Vendelman, 1987).Brian Harris는 그의 "Bi-text"를 통해 또 다른 중요한 조치를 취했다.그는 바이텍스트를 "2차원의 단일 텍스트"(1988)라고 정의했다.이는 Sadler의 2개 국어 Knowledge Bank와 유사한 메아리를 만든 번역 유닛을 통한 번역자의 활동과 관련된 소스 및 타깃 텍스트이다.그리고 Harris의 연구에서 그는 이 이름을 사용하지 않고 TM 시스템과 같은 것을 제안했습니다.즉, 각각의 단어 또는 "전체 번역 유닛"으로 검색할 수 있는 페어링된 번역 데이터베이스입니다.후자의 경우 검색은 동일한 유닛이 아닌 유사한 유닛을 검색할 수 있습니다.

TM 테크놀로지는 1990년대 후반에야 상업적으로 이용 가능하게 되었습니다.그 때문에, 복수의 엔지니어와 번역자의 노력이 필요하게 되었습니다.주목되는 것은 Trados(현재의 SDL Trados)라는 최초의 TM 툴입니다.이 툴에서는 소스 파일을 열고 번역 메모리를 적용하여 텍스트 내의 "100% 일치"(동일 일치) 또는 "퍼지 일치"(동일하지 않음)를 즉시 추출하여 대상 파일 내에 배치합니다.그 후, 번역 메모리에 의해서 제안된 「일치」는 받아들여지거나 새로운 대체 방법으로 덮어쓸 수 있습니다.번역 유닛을 수동으로 갱신하는 경우 번역 유닛은 나중에 사용할 수 있도록 번역 메모리에 저장되며 현재 텍스트에서 반복할 수도 있습니다.마찬가지로 "일치"가 없는 타깃파일 내의 모든 세그먼트는 수동으로 번역되어 자동으로 번역 메모리에 추가됩니다.

2000년대에 온라인 번역 서비스에는 TM이 도입되기 시작했습니다.Google Translate 의 기계번역 서비스 및 Gengo나 Akuna 등의 사이트에서 제공하는 프로페셔널하고 "하이브리드" 번역 서비스에는 번역자 및 자원봉사자가 제공하는 TM 데이터 데이터베이스가 포함되어 언어 간의 보다 효율적인 접속을 통해 최종 [4]사용자에게 보다 빠른 번역 서비스를 제공합니다.

최근의 동향

최근에 개발된 것 중 하나는 번역 [5]메모리와 대조되는 '텍스트 메모리'의 개념입니다.이는 제안된 LISA OSCAR [6]표준의 기초이기도 합니다.xml:tm 내의 텍스트 메모리는 '작성자 메모리'와 '번역 메모리'로 구성됩니다.작성자 메모리는 작성 주기 동안 변경사항을 추적하는 데 사용됩니다.변환 메모리는 작성자 메모리의 정보를 사용하여 변환 메모리 조회를 구현합니다.주로 XML 문서를 대상으로 하지만 xml:tm은 XLIFF[7] 형식으로 변환할 수 있는 모든 문서에서 사용할 수 있습니다.

2세대 번역 메모리

1세대 TM 시스템보다 훨씬 강력하며 언어 분석 엔진이 포함되어 있으며 청크 기술을 사용하여 세그먼트를 지능형 용어 그룹으로 나누고 특정 용어집을 자동으로 생성합니다.

관련 기준

TMX

Translation Memory eXchange(TMX)는 번역 공급자 간에 번역 메모리를 교환할 수 있는 표준입니다.TMX는 번역 메모리를[citation needed] Import 및 내보내기 위한 최선의 방법으로 번역 커뮤니티에 채택되어 있습니다.현재 버전은 1.4b입니다. TMX 데이터에서 원본 원본 및 대상 문서를 다시 작성할 수 있습니다.

TBX

TermBase eXchange.ISO 30042로 개정 및 재게시된 이 LISA 표준은 상세한 어휘 정보를 포함한 용어 데이터의 교환을 허용한다.TBX의 프레임워크는 ISO 12620, ISO 12200 및 ISO 16642의 3가지 ISO 표준에 의해 제공됩니다.ISO 12620은 데이터 요소 유형 또는 사전 정의된 값으로 기능하는 표준화된 이름을 가진 잘 정의된 "데이터 범주"의 인벤토리를 제공합니다.ISO 12200(MARTIF라고도 함)은 TBX의 코어 구조의 기초를 제공합니다.ISO 16642(용어 마크업 프레임워크라고도 함)는 일반적으로 용어 마크업 언어의 구조 메타 모델을 포함합니다.

UTX

보편적 용어를 인식 유통 센터(내비게이션)방식이 표준 구체적으로 기계 번역의 사용자 사전을 사용해야 하지만, 일반, 사람이 glossaries에 쓰일 수 있습니다.내비게이션의 목적은 그것의 아주 단순하고 실용적인 사양에서 사전 공유와 재사용을 가속화시키는 것이다.

SRX

분할 규칙 교차점(SRX)는 애플리케이션 간에 교환된다 번역 메모리 데이터 더 효과적으로 사용할 수 있는 TMX 수준을 향상시키기 위한 것이다.능력은 이전의 번역에 사용된 분할 규칙을 지정할 수 성취될 수 있는 활용을 높일 수 있다.

GMX

GILT 측정.GILT(글로벌화, 국제화, 지역화, 그리고 번역)을 의미한다.그 GILT 측정 표준 품질 지표의 대량 메트릭스, GMX-C 복잡성 측정법에, GMX-Q을 위해 세개의 부품:GMX-V로 구성되어 있다.제안된 GILT 측정 표준 어떤 주어진 GILT 일을 위한 작업량 및 품질 요구 사항들을 수량화하는 업무를 맡고 있다.

OLIF

오픈 렉시콘 교환 포맷.및 어휘 용어의 데이터의 교환에 대한 OLIF은 개방되어,XML-compliant 표준입니다.비록 원래 어휘 데이터의 특허 기계 번역 lexicons 사이의 교환을 위한 수단으로써 의도한,terminology 교환으로 보다 포괄적인 표준으로 발전했다.[8]

XLIFF

XMLLocalisation 교환 파일 포맷(XLIFF) 어떠한 국산화 공급자가 이해될 수 있는 하나의 인터체인지 파일 포맷을 제공하기 위한 것이다.번역 산업에 XML형식의 데이터를 교환하 XLIFF가 선호되는 way[9][10].[11]

트랜스WS

번역 웹 서비스.TransWS의 통화 파일과 메시지를localization 사업과 관련된 것을 제출하고 검색을 위해 웹 서비스 사용해야 했던 지정합니다.그것은 웹 서비스의 사용은 현재 국산화 과정의 상당 부분의 자동화를 위한 상세한 틀 역할을 위한 것이다.[12]

xml: tm

번역 메모리에 대한 xml:tm(XML 기반 텍스트 메모리) 접근법은 작성자와 번역 [13]메모리로 구성된 텍스트메모리의 개념에 기초하고 있습니다.xml:tm은 XML-INTL에 의해 Lisa OSCAR에 기부되었습니다.

PO

Gettext Portable Object 형식입니다.Gettext PO 파일은 번역 메모리 형식으로 간주되지 않는 경우가 많지만 번역 메모리 프로세스에서도 번역 메모리를 사용하는 것과 같은 방법으로 사용되는 이중 언어 파일입니다.일반적으로 PO 번역 메모리 시스템은 디렉토리 트리 구조 내의 다양한 개별 파일로 구성됩니다.PO 파일로 동작하는 일반적인 툴로는 GNU Gettext ToolsTranslate Toolkit이 있습니다.PO 파일이 단순한 소스 텍스트 파일인 것처럼 편집하는 여러 도구와 프로그램도 있습니다.

「 」를 참조해 주세요.

레퍼런스

  1. ^ a b Elina Lagoudaki (2006), "번역 메모리 시스템: 사용자의 관점을 계몽합니다.2006년 7월부터 8월에 걸쳐 실시된 TM Survey 2006의 주요 조사 결과 (임페리얼 칼리지 런던, 번역 메모리 조사 2006), 페이지"Archived copy" (PDF). Archived from the original (PDF) on 2007-03-25. Retrieved 2007-03-25.{{cite web}}: CS1 maint: 제목으로 아카이브된 복사(링크)
  2. ^ Kay, Martin (March 1997). "The Proper Place of Men and Machines in Language Translation". Machine Translation. 12 (1–2): 3–23. doi:10.1023/A:1007911416676. S2CID 207627954.
  3. ^ Arthern, Peter (1978). "Machine Translation and Computerized Terminology Systems: A Translator's Perspective" (PDF). Translating and the Computer: Proceedings of a Seminar, London, 14th November, 1978. ISBN 0444853022.
  4. ^ 구글의 AI 번역 툴이 자체 비밀 내부 언어 Devin Coldewey, TechCrunch, 2016년 11월 22일
  5. ^ XML 문서를 xml:tm에 의한 변환
  6. ^ xml: tm
  7. ^ XLIFF
  8. ^ 렉시콘 교환 형식 열기
  9. ^ "DITA Translation SC OASIS". www.oasis-open.org. Retrieved 2021-01-29.
  10. ^ Roturier, Johann (2019-08-23), O’Hagan, Minako (ed.), "XML for translation technology", The Routledge Handbook of Translation and Technology (1 ed.), Abingdon, Oxon: Routledge, pp. 45–60, doi:10.4324/9781315311258-3, ISBN 978-1-315-31125-8, S2CID 213287381, retrieved 2021-01-29
  11. ^ XML 현지화 인터체인지 파일 형식
  12. ^ 번역 웹 서비스
  13. ^ Andrzej Zydroń (August 2008). "OAXAL—What is it and why should I care". CIDM Information Management News. Archived from the original on May 17, 2013. Retrieved March 30, 2013. At the core of xml:tm are the following concepts which together make up 'Text Memory': Author Memory and Translation Memory.

추가 정보

  • 드래그스테드, 바바라(2004).번역 및 번역 메모리 시스템에서의 세그먼트화: TM 시스템을 번역 프로세스에 통합하는 인지기능 분할효과에 대한 경험적 조사.코펜하겐: Samfundsliteratur.369 pm.
  • 안녕, 마티아스.(1998)."번역 메모리:통찰력과 전망.인: Lyne Bowker; et al. (ed.) , 다양성의 유니티? 번역 연구의 최신 동향성 제롬페이지 123~136.
  • 마르틴-모르, 아드리아(2011), La interferéncia lingüstica en entornes de Traducio Assistida per Ordador: 레서카 엠피리코 실험.벨라테라:바르셀로나 대학URL : http://www.tdx.cat/handle/10803/83987
  • 오헤건, 미나코(2009)."컴퓨터 지원 번역(CAT)": 모나 베이커 & 가브리엘라 살다냐 (ed.)번역학 루트리지 백과사전런던: 루트리지.페이지 48~51
  • Pym, Anthony(2013).기계 번역 시대의 번역 스킬 세트.메타: 번역자 저널, 58(3), 페이지 487-503.URL : http://id.erudit.org/iderudit/1025047ar

외부 링크