광학 문자 인식 소프트웨어 비교

Comparison of optical character recognition software

이러한 광학 문자 인식 소프트웨어의 비교에는 다음이 포함된다.

  • 실제 문자 식별을 수행하는 OCR 엔진
  • 스캔한 문서를 OCR에 적합한 영역으로 나누는 레이아웃 분석 소프트웨어
  • 하나 이상의 OCR 엔진에 대한 그래픽 인터페이스
  • OCR 기능을 다른 소프트웨어에 추가하는 데 사용되는 소프트웨어 개발 키트(예: 양식 처리 애플리케이션, 문서 이미징 관리 시스템, 전자 검색 시스템, 레코드 관리 솔루션)
정렬 가능한 테이블
이름 설립년도 최신 안정화 버전 출시년도 면허증 온라인. 창문들 맥 OS X 리눅스 BSD 안드로이드 iOS 프로그래밍 언어 SDK? 언어들 글꼴 출력 형식 메모들
Google 드라이브 OCR 또는 Google 클라우드 비전 2015 소유권 브라우저 브라우저 브라우저 알 수 없는 ? ? 알 수 없는 200+ 모든 글꼴 문자 메시지를 보내다 구글 블로그 게시물[1][2]
테세락트 1985 5.1.0 2022 아파치 아니요. ? ? C++, C 100+[3] 인쇄된 글꼴 텍스트, ALTO, hOCR,[4] PDF, 사용자 인터페이스[5] 또는 API가 서로 다른 기타 Hewlett-Packard에서 제작, Google에서[6] 추가 개발 중
ABBYY FineReader 1989 15 2019 소유권 아니요. C/C++ 192[7] 모든 글꼴 DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPB2[8] ABBYY는 임베디드 및 모바일 기기용 SDK도 공급한다.Windows용 프로페셔널, 기업용 및 사이트 라이센스 버전, Mac용 Express Edition.[9]
이악샤라얀 2010 아니요. 아니요. ? ? 14 RTF, TXT, BRL
Asenterprise OCR SDK 1998 15 2015 소유권 ? ? 자바, C#, VB.NET, C/C++/델피 20+[10] ? 일반 텍스트, 검색 가능한 PDF, XML[11] 자바, C#, VB.Windows, Linux, Mac OS X 및 Unix에서 OCR 및 바코드 인식용 NET,[12] C/C++/Delphi SDKs
AnyDoc 소프트웨어 1989 ? ? 소유권 아니요. 아니요. 아니요. 아니요. ? ? VBScript ? ? ? 구조화, 반구조화 및 구조화되지 않은 문서와 함께 작업.
쿠나이폼 1996 1.1 2011-04-19 BSD 변종 아니요. ? ? C/C++ 28 인쇄된 글꼴 HTML, hOCR, 네이티브, RTF, TeXT, TXT[13] 엔터프라이즈급 시스템, 텍스트 형식을 저장할 수 있으며 모든 구조의 복잡한 테이블을 인식
Dynamicsoft OCR SDK 2003 8.2 2012 소유권 아니요. 아니요. 아니요. ? ? C/C++ 40+[14] ? PDF, TXT
옴니페이지 1970년대 19.2 2015 소유권 아니요. ? ? C/C++, C#[15] 125[16] 기계 및 핸드프린트 글꼴 DOC/DOCX XLS/XLSX PPTX RTF PDF/A 검색 가능한 PDF HTML 텍스트 XML ePUB MP3 누앙스 커뮤니케이션의 제품
Microsoft Office OneNote 2007 2011 ? 2007 소유권 아니요. 아니요. 아니요. 아니요. ? ? ? ? ? ?
GOCR 2000 0.52[17] 2018-10-15 GPL [18] ? ? C ? 20+ ?
오크라드 ? 0.26[19] 2017-03-31 GPL 아니요. ? ? C++ 라틴 문자 ? 명령줄
스마트스코어 1991 10.5.8 2015-07 소유권 아니요. 아니요. 아니요. ? ? ? ? ? ? 악보를 위해서.
Microsoft Office Document Imaging ? 오피스 2007 2007 소유권 아니요. 아니요. 아니요. 아니요. ? ? ? ? ? ? OmniPage[citation needed] 사용
퓨마넷 ? ? 2009-10-29 BSD 아니요. 아니요. 아니요. 아니요. ? ? C# 28 인쇄된 글꼴 .NET OCR SDK는 인지기술의 CuneiForm 인식엔진을 기반으로 한다.Puma COM 서버를 래핑하고 에 대한 단순화된 API를 제공하십시오.NET 애플리케이션
ReadSoft ? ? ? 소유권 아니요. 아니요. 아니요. 아니요. ? ? ? ? ? ? 비즈니스 프로세스와 통합된 송장, 양식 및 구매 주문서와 같은 비즈니스 문서 스캔, 캡처 및 분류
스칸트론 ? ? ? 소유권 아니요. 아니요. 아니요. 아니요. ? ? ? ? ? ? 지역화된 인터페이스로 작업하려면 해당 언어 지원이 필요하다.
OCRFeeder 2009-03 0.8.3 2014-12-22 GPL 아니요. 아니요. 아니요. 아니요. ? ? 파이톤 ? ? ? 전체 사용자 인터페이스를 특징으로 하며 자동 작동을 위한 명령줄 도구가 있다.자체 분할 알고리즘이 있지만 Teseract 또는 Ocrad와 같은 시스템 전체 OCR 엔진 사용
오크로푸스 2007 1.3.3 2017-12-16 아파치 아니요. 아니요. ? ? 파이톤 ? 라틴 스크립트를 사용하는 모든 언어(다른 언어를 교육할 수 있음) 일반 라틴어 스크립트 및 Fraktur(다른 스크립트는 교육 가능) TXT, hOCR,[20] PDF[21] 현재 개발 중인 플러그형 프레임워크, Google Books에 사용
이름 설립년도 최신 안정화 버전 출시년도 면허증 온라인. 창문들 맥 OS X 리눅스 BSD 안드로이드 iOS 프로그래밍 언어 SDK? 언어들 글꼴 출력 형식 메모들

평가하기

OCR 패키지 Google 오피스 OCR, Tesseract, ABB의 정확성 및 신뢰성 분석YY FineReader 및 Transim, 15개 범주의 이미지 1227개를 포함한 데이터 세트를 채택하여 Google Docs OCR 및 ABB로 결론 내렸다.YY가 남들보다 더 잘 해내고 있다.[22]

참조

  1. ^ "Supported languages". Feb 11, 2022.
  2. ^ Ashok Popat (Sep 4, 2015). "IEEE SPS: Optical Character Recognition for Most of the World's Languages". Archived from the original on 2021-12-20.
  3. ^ 버전 3.04에 대한 언어 교육 파일 수를 기준으로 함.다운로드 페이지에서 사용 가능.
  4. ^ Texeract ReadmeFAQ에 설명된 사용법
  5. ^ OCRFeeder를 사용한 ODF와 같은 기능
  6. ^ "GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)". Retrieved 2018-11-05.
  7. ^ "ABBYY FineReader 14: Technical Specifications". Finereader.abbyy.com. Retrieved 2017-02-23.
  8. ^ "ABBYY FineReader 11: Technical Specifications". Finereader.abbyy.com. Retrieved 2013-09-12.
  9. ^ "Top OCR Software". Ocrworld.com. 2010-03-30. Archived from the original on 2017-02-23. Retrieved 2013-09-12.
  10. ^ "Asprise OCR SDK Features". asprise.com. Retrieved 2014-06-21.
  11. ^ "Asprise Java OCR Library Features". asprise.com. Retrieved 2014-06-21.
  12. ^ "Asprise Java, C#/VB.NET OCR API". asprise.com. 2015-11-19. Retrieved 2015-11-19.
  13. ^ Linux용 Cuniform 버전 1.1.0에 대한 Debian 설명서 페이지
  14. ^ "OCR SDK Language Packages Download". Dynamsoft.com. Retrieved 2013-09-12.
  15. ^ "OmniPage CSDK - OCR Document Capture Toolkit Document Imaging & OCR". Nuance. Archived from the original on 2010-08-24. Retrieved 2013-09-12.
  16. ^ "OmniPage Standard Document Conversion". Nuance. Archived from the original on 2014-03-13. Retrieved 2014-02-25.
  17. ^ "GOCR Homepage". wasd.urz.uni-magdeburg.de. Retrieved 2018-10-17.
  18. ^ "GOCR". Jocr.sourceforge.net. Retrieved 2013-09-12.
  19. ^ Diaz, Antonio (2015-04-16). "GNU Ocrad 0.26 released" (Mailing list). info-gnu.
  20. ^ OCRopus는 인식 결과로부터 hOCR을 생성하는 Ocropus-hocrat 도구를 포함한다.
  21. ^ hocr-tools와 결합
  22. ^ Assefi, Mehdi (2016-12-01). "OCR as a Service: An Experimental Evaluation of Google Docs OCR, Tesseract, ABBYY FineReader, and Transym". ResearchGate. Retrieved 2019-01-31.