광학 문자 인식 소프트웨어 비교
Comparison of optical character recognition software이러한 광학 문자 인식 소프트웨어의 비교에는 다음이 포함된다.
- 실제 문자 식별을 수행하는 OCR 엔진
- 스캔한 문서를 OCR에 적합한 영역으로 나누는 레이아웃 분석 소프트웨어
- 하나 이상의 OCR 엔진에 대한 그래픽 인터페이스
- OCR 기능을 다른 소프트웨어에 추가하는 데 사용되는 소프트웨어 개발 키트(예: 양식 처리 애플리케이션, 문서 이미징 관리 시스템, 전자 검색 시스템, 레코드 관리 솔루션)
이름 | 설립년도 | 최신 안정화 버전 | 출시년도 | 면허증 | 온라인. | 창문들 | 맥 OS X | 리눅스 | BSD | 안드로이드 | iOS | 프로그래밍 언어 | SDK? | 언어들 | 글꼴 | 출력 형식 | 메모들 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Google 드라이브 OCR 또는 Google 클라우드 비전 | 2015 | 소유권 | 네 | 브라우저 | 브라우저 | 브라우저 | 알 수 없는 | ? | ? | 알 수 없는 | 네 | 200+ | 모든 글꼴 | 문자 메시지를 보내다 | 구글 블로그 게시물[1][2] | ||
테세락트 | 1985 | 5.1.0 | 2022 | 아파치 | 아니요. | 네 | 네 | 네 | 네 | ? | ? | C++, C | 네 | 100+[3] | 인쇄된 글꼴 | 텍스트, ALTO, hOCR,[4] PDF, 사용자 인터페이스[5] 또는 API가 서로 다른 기타 | Hewlett-Packard에서 제작, Google에서[6] 추가 개발 중 |
ABBYY FineReader | 1989 | 15 | 2019 | 소유권 | 네 | 네 | 네 | 아니요. | 네 | 네 | 네 | C/C++ | 네 | 192[7] | 모든 글꼴 | DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF, HTML, CSV, TXT, ODT, DjVu, EPB2[8] | ABBYY는 임베디드 및 모바일 기기용 SDK도 공급한다.Windows용 프로페셔널, 기업용 및 사이트 라이센스 버전, Mac용 Express Edition.[9] |
이악샤라얀 | 2010 | 네 | 아니요. | 네 | 아니요. | ? | ? | 14 | RTF, TXT, BRL | ||||||||
Asenterprise OCR SDK | 1998 | 15 | 2015 | 소유권 | 네 | 네 | 네 | 네 | 네 | ? | ? | 자바, C#, VB.NET, C/C++/델피 | 네 | 20+[10] | ? | 일반 텍스트, 검색 가능한 PDF, XML[11] | 자바, C#, VB.Windows, Linux, Mac OS X 및 Unix에서 OCR 및 바코드 인식용 NET,[12] C/C++/Delphi SDKs |
AnyDoc 소프트웨어 | 1989 | ? | ? | 소유권 | 아니요. | 네 | 아니요. | 아니요. | 아니요. | ? | ? | VBScript | ? | ? | ? | 구조화, 반구조화 및 구조화되지 않은 문서와 함께 작업. | |
쿠나이폼 | 1996 | 1.1 | 2011-04-19 | BSD 변종 | 아니요. | 네 | 네 | 네 | 네 | ? | ? | C/C++ | 네 | 28 | 인쇄된 글꼴 | HTML, hOCR, 네이티브, RTF, TeXT, TXT[13] | 엔터프라이즈급 시스템, 텍스트 형식을 저장할 수 있으며 모든 구조의 복잡한 테이블을 인식 |
Dynamicsoft OCR SDK | 2003 | 8.2 | 2012 | 소유권 | 네 | 네 | 아니요. | 아니요. | 아니요. | ? | ? | C/C++ | 네 | 40+[14] | ? | PDF, TXT | |
옴니페이지 | 1970년대 | 19.2 | 2015 | 소유권 | 네 | 네 | 네 | 네 | 아니요. | ? | ? | C/C++, C#[15] | 네 | 125[16] | 기계 및 핸드프린트 글꼴 | DOC/DOCX XLS/XLSX PPTX RTF PDF/A 검색 가능한 PDF HTML 텍스트 XML ePUB MP3 | 누앙스 커뮤니케이션의 제품 |
Microsoft Office OneNote 2007 | 2011 | ? | 2007 | 소유권 | 아니요. | 네 | 아니요. | 아니요. | 아니요. | ? | ? | ? | ? | ? | ? | ||
GOCR | 2000 | 0.52[17] | 2018-10-15 | GPL | 네[18] | 네 | 네 | 네 | 네 | ? | ? | C | ? | 20+ | ? | ||
오크라드 | ? | 0.26[19] | 2017-03-31 | GPL | 네 | 아니요. | 네 | 네 | 네 | ? | ? | C++ | 네 | 라틴 문자 | ? | 명령줄 | |
스마트스코어 | 1991 | 10.5.8 | 2015-07 | 소유권 | 아니요. | 네 | 네 | 아니요. | 아니요. | ? | ? | ? | ? | ? | ? | 악보를 위해서. | |
Microsoft Office Document Imaging | ? | 오피스 2007 | 2007 | 소유권 | 아니요. | 네 | 아니요. | 아니요. | 아니요. | ? | ? | ? | ? | ? | ? | OmniPage[citation needed] 사용 | |
퓨마넷 | ? | ? | 2009-10-29 | BSD | 아니요. | 네 | 아니요. | 아니요. | 아니요. | ? | ? | C# | 네 | 28 | 인쇄된 글꼴 | .NET OCR SDK는 인지기술의 CuneiForm 인식엔진을 기반으로 한다.Puma COM 서버를 래핑하고 에 대한 단순화된 API를 제공하십시오.NET 애플리케이션 | |
ReadSoft | ? | ? | ? | 소유권 | 아니요. | 네 | 아니요. | 아니요. | 아니요. | ? | ? | ? | ? | ? | ? | 비즈니스 프로세스와 통합된 송장, 양식 및 구매 주문서와 같은 비즈니스 문서 스캔, 캡처 및 분류 | |
스칸트론 | ? | ? | ? | 소유권 | 아니요. | 네 | 아니요. | 아니요. | 아니요. | ? | ? | ? | ? | ? | ? | 지역화된 인터페이스로 작업하려면 해당 언어 지원이 필요하다. | |
OCRFeeder | 2009-03 | 0.8.3 | 2014-12-22 | GPL | 아니요. | 아니요. | 아니요. | 네 | 아니요. | ? | ? | 파이톤 | ? | ? | ? | 전체 사용자 인터페이스를 특징으로 하며 자동 작동을 위한 명령줄 도구가 있다.자체 분할 알고리즘이 있지만 Teseract 또는 Ocrad와 같은 시스템 전체 OCR 엔진 사용 | |
오크로푸스 | 2007 | 1.3.3 | 2017-12-16 | 아파치 | 아니요. | 아니요. | 네 | 네 | 네 | ? | ? | 파이톤 | ? | 라틴 스크립트를 사용하는 모든 언어(다른 언어를 교육할 수 있음) | 일반 라틴어 스크립트 및 Fraktur(다른 스크립트는 교육 가능) | TXT, hOCR,[20] PDF[21] | 현재 개발 중인 플러그형 프레임워크, Google Books에 사용 |
이름 | 설립년도 | 최신 안정화 버전 | 출시년도 | 면허증 | 온라인. | 창문들 | 맥 OS X | 리눅스 | BSD | 안드로이드 | iOS | 프로그래밍 언어 | SDK? | 언어들 | 글꼴 | 출력 형식 | 메모들 |
평가하기
OCR 패키지 Google 오피스 OCR, Tesseract, ABB의 정확성 및 신뢰성 분석YY FineReader 및 Transim, 15개 범주의 이미지 1227개를 포함한 데이터 세트를 채택하여 Google Docs OCR 및 ABB로 결론 내렸다.YY가 남들보다 더 잘 해내고 있다.[22]
참조
- ^ "Supported languages". Feb 11, 2022.
- ^ Ashok Popat (Sep 4, 2015). "IEEE SPS: Optical Character Recognition for Most of the World's Languages". Archived from the original on 2021-12-20.
- ^ 버전 3.04에 대한 언어 교육 파일 수를 기준으로 함.다운로드 페이지에서 사용 가능.
- ^ Texeract Readme 및 FAQ에 설명된 사용법
- ^ OCRFeeder를 사용한 ODF와 같은 기능
- ^ "GitHub - tesseract-ocr/tesseract: Tesseract Open Source OCR Engine (main repository)". Retrieved 2018-11-05.
- ^ "ABBYY FineReader 14: Technical Specifications". Finereader.abbyy.com. Retrieved 2017-02-23.
- ^ "ABBYY FineReader 11: Technical Specifications". Finereader.abbyy.com. Retrieved 2013-09-12.
- ^ "Top OCR Software". Ocrworld.com. 2010-03-30. Archived from the original on 2017-02-23. Retrieved 2013-09-12.
- ^ "Asprise OCR SDK Features". asprise.com. Retrieved 2014-06-21.
- ^ "Asprise Java OCR Library Features". asprise.com. Retrieved 2014-06-21.
- ^ "Asprise Java, C#/VB.NET OCR API". asprise.com. 2015-11-19. Retrieved 2015-11-19.
- ^ Linux용 Cuniform 버전 1.1.0에 대한 Debian 설명서 페이지
- ^ "OCR SDK Language Packages Download". Dynamsoft.com. Retrieved 2013-09-12.
- ^ "OmniPage CSDK - OCR Document Capture Toolkit Document Imaging & OCR". Nuance. Archived from the original on 2010-08-24. Retrieved 2013-09-12.
- ^ "OmniPage Standard Document Conversion". Nuance. Archived from the original on 2014-03-13. Retrieved 2014-02-25.
- ^ "GOCR Homepage". wasd.urz.uni-magdeburg.de. Retrieved 2018-10-17.
- ^ "GOCR". Jocr.sourceforge.net. Retrieved 2013-09-12.
- ^ Diaz, Antonio (2015-04-16). "GNU Ocrad 0.26 released" (Mailing list). info-gnu.
- ^ OCRopus는 인식 결과로부터 hOCR을 생성하는 Ocropus-hocrat 도구를 포함한다.
- ^ hocr-tools와 결합
- ^ Assefi, Mehdi (2016-12-01). "OCR as a Service: An Experimental Evaluation of Google Docs OCR, Tesseract, ABBYY FineReader, and Transym". ResearchGate. Retrieved 2019-01-31.