LaTeXML

LaTeXML
LaTeX에서 XML/HTML/MathML 변환기
원본 작성자브루스 R 밀러
초기 릴리즈2004년 5월 10일(17년)(2004-05-10)
안정적 해제
0.8.6 / 2021년 9월 30일 (5개월 전) (2021-09-30)
리포지토리
기록 위치
운영 체제Unix 유사, MacOS, Windows
유형문서 변환기
면허증공용 도메인
웹사이트dlmf.nist.gov/LaTeXML/

LaTeXMLLaTeX 문서를 XML, HTML, EPUB, JATS, TEI로 변환하는 무료 공용 도메인 소프트웨어다.[1][2][3]

워크플로우

LaTeXML의 기본 출력 형식은 (La)TeX 문서 모델의 XML 표현이다.포스트 프로세서는 이러한 XML 문서를 다른 구조화된 형식으로 변환할 수 있다.공통의 활용 사례는 수학 공식을 이미지로 한 HTML이나 수식을 가진 XHTML, HTML5, EPUB를 생성한다. 다른 LaTeX-to-XML 프로세서에 비해 LaTeXML은 LaTeX 마크업의 의미 구조를 보존하는 것을 목표로 한다.이것은 수학 검색과 같은 의미 서비스의 좋은 기반이 된다.

변환 시간은 단일 공식(LaTeXML 데몬에서)의 경우 30밀리초부터 책 크기 문서의 경우 분까지입니다.

역사

LaTeXML은 NIST디지털 수학적 기능 라이브러리의 맥락에서 시작되었으며, 여기서 LaTeX 문서는 웹에서 출판되기 위해 준비되어야 했다.이 시스템은 10년 넘게 활발한 개발이 진행되어 왔으며, 프로젝트 원저자인 브루스 밀러를 중심으로 작지만 헌신적인 개발자 및 사용자 커뮤니티를 끌어모으고 있다.

현재 출시된 버전은 LaTeXML 0.8.6이다.2021년 9월에 발매되었으며, 공공 리포지토리에서 개발이 활발히 진행되고 있다.

주목할 만한 사용법

LaTeXML은 53만 개의 문서 중 90%(오류 없이 60%)를 arXiv에서 XML로 변환하는 데 사용되었으며,[4] 커버리지 강화를 위한 지속적인 노력의 결과로 LaTeXML은 광범위한 LaTeX 패키지를 지원한다.ACL 2014 컨퍼런스는 LaTeXML을 사용하여 제출된 문서를 XML로 변환했으며,[5] 이는 추가 분석을 위해 ACL Anthology 논문을 고품질 의미 표시로 변환하려는 기존 작업에 이은 것이다.[6]2013년 2월부터 LaTeXML은 피어 생산 수학 웹사이트인 PlanetMath의 웹 페이지를 렌더링하는 데 이용되었다.2015년 7월 이후, Autorea에 의해 진보된 LaTeX 지원을 위해 채택되었다.[7]2018년 유럽우주국(European Space Agency)의 가이아 프로젝트의 두 번째 데이터 공개가[8] LaTeXML을 통해 실현되었다.

2022년 2월, ArXiv는 LaTeXML을 기반으로 한 실험 서비스를 발표하여 178만 개의 문서를 HTML5로 제공했으며, LaTeXML 개발자는 "적어도 부분적으로 볼 수 있다"는 기사가 97%로, arXiv의 74%를 성공적으로 변환했다고 주장했다.[9]

실행

LaTeXML의 핵심은 사용자 정의 가능한 XML 이미터와 결합된 TeX의 파싱 및 소화 알고리즘의 Perl 재구축이다.LaTeX 마크업에서 의미 구조를 보존하기 위해, LaTeXML은 높은 수준의 매크로 정의를 가진 모든 LaTeX 패키지에 대한 XML 바인딩이 필요하다.LaTeXML 배포판은 현재 AMSTeX, Babel[10], PGF/TikZ와 같이 일반적으로 사용되는 200개 이상의 LaTeX 패키지에 대한 XML 바인딩을 제공하고 있다(실험 지원만 있을 뿐).

LaTeXML 변환은 다음 두 단계로 구성된다.

  • 첫 번째 분석은 LaTeX를 파싱하고 LaTeX 근접한 XML 문서 유형으로 변환하며,
  • 두 번째(후 처리)는 XML을 표준화된 구조화된 출력 형식 중 하나로 변환한다.

LaTeXML 0.8은 데몬 기능을 추가하여 여러 변환과 웹 서비스에 쉽게 내장할 수 있도록 했다.

참조

  1. ^ "Gecko-based EPUB Readers and LaTeXML". Archived from the original on 2014-08-22. Retrieved 2020-02-21.
  2. ^ "Tools for Converting LaTeX to XML".
  3. ^ "Free Techno Blog: LaTeXML". Archived from the original on 2015-05-11. Retrieved 2014-02-11.
  4. ^ Stamerjohanns, Heinrich; Kohlhase, Michael; Ginev, Deyan; David, Catalin; Miller, Bruce (2010). Transforming large collections of scientific publications to XML (PDF). Mathematics in Computer Science. Vol. 3, no. 3. Birkhäuser. pp. 299–307.
  5. ^ "ACL 2014 Publication - Papers in XML format".
  6. ^ Schäfer, Ulrich; Read, Jonathon; Oepen, Stephan (2012). Towards an ACL anthology corpus with logical document structure: an overview of the ACL 2012 contributed task (PDF). ACL-2012 Special Workshop on Rediscovering 50 Years of Discoveries. pp. 88–97.
  7. ^ "Authorea Newsletter - July 2015: Full LaTeX, Templates, and Ebola on Authorea". Authorea. Retrieved 2018-08-18.
  8. ^ "Gaia Data Release 2Documentation release 1.1". gea.esac.esa.int. Retrieved 2018-08-18.
  9. ^ "arXiv articles as responsive web pages". arXiv. Retrieved 2022-02-23.
  10. ^ "LaTeXML: Localization with Babel".

외부 링크