실현(언어학)
Realization (linguistics)언어학에서 실현이란 어떤 종류의 표면표현이 그것의 기초적인 표현으로부터 파생되는 과정이다. 즉, 언어 분석의 어떤 추상적인 대상이 실제 언어로 생산되는 방식이다. 음핵은 흔히 말소리에 의해 실현된다고 한다. 특정한 음소를 실현할 수 있는 다른 소리를 그것의 알로폰이라고 부른다.
실현은 또한 자연어 생성의 하위 작업으로, 통사적 표현으로부터 인간 언어(영어, 프랑스어 등)로 실제 텍스트를 생성하는 것을 포함한다. 실현 가능한 소프트웨어 패키지는 여러 가지가 있는데, 대부분은 NLG의 학술연구단체에서 개발한 것이다. 이 글의 나머지 부분은 이런 종류의 실현에 관한 것이다.
예
예를 들어, 다음의 자바 코드는 심플렌lg 시스템[2]으로 하여금 <여자들은 담배를 피우지 않는다>라는 텍스트를 출력하게 한다.
NPPhraseSpec 주제 = nlg팩토리.CreateNounPhase("더", "여자"); 주제.setPlural(진실의); SPhraseSpec 형을 언도하다 = nlg팩토리.createClause(주제, "smoke"); 형을 언도하다.setFeature(특징.부정됨, 진실의); 시스템.밖으로.인쇄하다(실감나게 하다.실감센던스(형을 언도하다));
이 예에서 컴퓨터 프로그램은 문장의 언어적 성분(Verb, subject)과 언어적 특징(농어적 주제, 부정)을 명시하였으며, 이 정보로부터 실재자가 실제 문장을 구성하였다.
처리.
실현에는 세 가지 종류의 처리가 포함된다.
구문적 실현: 문법 지식을 사용하여 변형을 선택하고 함수 단어를 추가하며 구성 요소의 순서를 결정한다. 예를 들어, 영어에서는 보통 주제가 동사보다 앞서고, 부정된 형태의 연기는 담배를 피우지 않는다.
형태학적 실현: 컴퓨터 형태는 다양하다. 예를 들어 여성의 복수 형태는 여성(여성이 아님)이다.
맞춤법 실현: 케이싱, 구두점 및 형식 지정 처리. 예를 들어, The는 문장의 첫 단어이기 때문에 대문자로 삼는다.
위의 예는 매우 기초적이며, 대부분의 실현자들은 상당히 복잡한 처리를 할 수 있다.
시스템들
지난 20년 동안 많은 현실주의자들이 개발되었다. 이러한 시스템은 처리의 복잡성과 정교성, 비정상적인 사례를 다루는 데 있어서의 강건성, API를 통해 프로그래밍 방식으로 접근되는지, 또는 구문 구조를 텍스트로 입력하는지에 있어서 차이가 있다.
또한 문서화, 지원, 라이센스 조건, 속도 및 메모리 사용 등과 같은 실용적 요소에도 큰 차이가 있다.
여기서 모든 실현자를 설명할 수는 없지만, 몇 가지 신흥 영역은 다음과 같다.
- Simplenlg [3]: 단순한 학습과 사용이 목적이었던 api로 엔진을 실현하는 문서로서, 문서의 표면적인 영역만을 찾는 범위 제한에 초점을 맞췄다.
- KPML [4]: 이것은 1980년대 이후 여러 다른 기구들로 개발되고 있는 가장 오래된 리얼라이저다. 그것은 10개의 다른 언어를 위한 문법이 있다.
- FUF/SURGE [5]: 1990년대에 널리 사용되었으며 오늘날에도 일부 프로젝트에서 사용되고 있는 현실주의자
- OpenCCG [6]: 통계 언어 모델을 사용하여 현실화 결정을 내리는 기능과 같은 여러 가지 좋은 기능을 갖춘 오픈 소스 리얼라이저.
참조
외부 링크
- [7] - ACL NLG 포털(위 및 기타 많은 실시에 대한 링크 포함)