폴리하프

Poliqarp

Poliqarp텍스트 [1][2]코퍼스를 처리하기 위해 설계된 오픈 소스 검색 엔진으로 폴란드 과학 아카데미 컴퓨터 과학 연구소에서 작성된 폴란드어 국립 코퍼스가 있습니다.

특징들

  • 커스텀 쿼리 언어[3]
  • 2-레벨 정규 표현식:
    • 말의 문자 수준에서 작동하다
    • 성명/단락의 단어 수준에서 작동하다
  • 뛰어난 퍼포먼스
  • 콤팩트한 말뭉치 표현(유사 프로젝트와 비교)
  • 운영체제 간 이동성: Linux/BSD/Win32
  • Endianness를 통한 이식성 결여(현재 릴리스는 작은 Endian 디바이스에서만 사용 가능)

레퍼런스

  1. ^ "Poliqarp search engine for NKJP data". nkjp.pl. Retrieved 1 December 2020.
  2. ^ "Poliqarp 1.1". nlp.ipipan.waw.pl. Retrieved 1 December 2020.
  3. ^ Janus, Daniel; Przepiórkowski, Adam (25 June 2007). "Poliqarp: an open source corpus indexer and search engine with syntactic extensions". Proceedings of the 45th Annual Meeting of the ACL on Interactive Poster and Demonstration Sessions. Association for Computational Linguistics. pp. 85–88. Retrieved 1 December 2020.

외부 링크