머리동작문구조문법
Head-driven phrase structure grammar머리동작문구구조문법(HPSG)은 칼 폴라드와 이반 사그가 개발한 고도로 어휘화된 제약에 기반한[1] 문법이다.[2][3] 종속문법과 달리 구문구조문법의 일종으로, 일반화된 구문구조문법의 즉각적인 계승이다. HPSG는 컴퓨터 과학(데이터형 이론과 지식 표현)과 같은 다른 분야에서 끌어와 페르디난드 드 사우수어의 기호 개념을 사용한다. 획일적인 형식주의를 사용하며 모듈식으로 구성돼 자연어 처리에 매력적이다.
HPSG 문법은 원리와 문법 규칙, 그리고 보통 문법에 속하지 않는 어휘목록을 포함한다. 형식주의는 어휘주의에 바탕을 두고 있다. 이것은 어휘목록이 단지 항목들의 목록 그 이상이라는 것을 의미한다; 그것은 그 자체로 풍부하게 구성되어 있다. 개별 항목에는 유형이 표시된다. 유형은 계층을 형성한다. 문법의 초기 버전은 문법 규칙(구성표)이 거의 없이 매우 어휘화되었다. 보다 최근의 연구는 점점 더 많은 규칙들을 더하는 경향이 있어, 건설 문법에 더 가까워지고 있다.[4]
HPSG가 다루는 기본형은 간판이다. 단어와 구절은 서로 다른 두 종류의 부호다. 단어의 특징으로는 [PHON](음, 음성 형태)과 [SYNSEM](구문적, 의미적 정보)의 두 가지가 있는데, 이 두 가지 모두 하위 기능으로 나뉜다. 부호와 규칙은 타이핑된 형상 구조로 공식화된다.
샘플 문법
HPSG는 유형 계층 구조 내의 위치와 내부 형상 구조로 정의되는 기호를 결합하여 문자열을 생성하며, AVM(속성 값 행렬)로 표현된다. [3][5] 형상은 유형 또는 유형 목록을 값으로 사용하고, 이러한 값은 차례로 고유한 형상 구조를 가질 수 있다. 문법적 규칙은 크게 서로에 대한 구속조건을 통해 표현된다. 부호의 특징 구조는 그것의 음운론적, 통사적, 의미적 특성을 설명한다. 공통 표기법에서 AVM은 대문자에 형상과 기울임꼴로 표시된 소문자로 표기된다. AVM에서 번호가 매겨진 지수는 토큰 동일한 값을 나타낸다.
단어에 대한 단순화된 AVM(이 경우 "주말 잘 걷는다"에서와 같이 명사가 아닌 동사"에서, 아래의 "걷는다"에서 동사의 범주형 정보(CAT)는 그것을 설명하는 특징(HEAD)과 그 주장을 설명하는 특징(VALENCE)으로 나뉜다.
"Walks"는 활자 동사의 머리를 가진 활자 단어의 표시다. 자동사 동사로서 "걷기"는 보완이 없지만 3인칭 단수명사인 주어가 필요하다. 주제(CENTER)의 의미적 가치는 동사의 유일한 주장(걸음을 하는 개인)과 함께 색인화된다. "그녀"에 대한 다음의 AVM은 그러한 요건을 충족할 수 있는 SYNSEM 값을 가진 부호를 나타낸다.
활자 문구의 기호는 한 명 이상의 아이와 통일되어 정보를 위쪽으로 전파한다. 다음의 AVM은 두 개의 자식, 즉 두 개의 자식(동사)과 동사의 SUBJ 제약 조건을 충족하는 비두아이를 필요로 하는 머리-하위-구어-구어-구어-구어-구어-구어-구어-구어-구어-구어-구어즈-구어즈-구어즈-구어즈-구어즈-구어즈-구어즈-구어즈-
최종 결과는 동사 헤드, 비어 있는 하위 카테고리화 특징, 그리고 두 아이에게 명령하는 음운학적 값이 있는 부호다.
HPSG의 실제 문법은 전체적으로 특징적인 구조로 구성되어 있지만, 언어학자들은 흔히 나무를 사용하여 등가 AVM이 다루기 어려운 부호의 통일을 나타낸다.
구현
HPSG 형식주의에 기반한 다양한 파서가 작성되었고 현재 최적화가 조사되고 있다. 독일어 문장을 분석하는 시스템의 예는 프리 우니베르시테트 베를린에 의해 제공된다.[6] 또한 베를린 프리 유니버스티테트 문법 그룹의 코어그램[7] 프로젝트에는 TRALE 시스템에서 구현된 오픈 소스 그래머가 제공된다. 현재 독일어,[8] 덴마크어,[9] 만다린 중국어,[10] 말티즈어,[11] 페르시아어를[12] 위한 문법들이 공통의 핵심을 공유하고 있으며 공개적으로 이용할 수 있다.
다양한 언어의 대형 HPSG 그래머가 HPSG Initiative(DELPH-IN)와 함께 Deep Language Processing(DELPH-IN)에서 개발되고 있다.[13] 영어,[14] 독일어,[15] 일본어의[16] 광범위한 문법은 오픈 소스 라이센스로 이용할 수 있다. 이러한 그래머는 LKB, PET,[17] Ace [18]및 동의와 같은 다양한 호환 오픈 소스 HPSG 파서들과 함께 사용할 수 있다.[19] 이 모든 것들은 "최소 재귀 의미론", MISS의 형식으로 의미적 표현을 만들어낸다.[20] HPSG 형식주의의 선언적 특성은 이러한 계산 그래머를 파싱과 생성(의미적 입력으로부터 표면 문자열을 생성)에 모두 사용할 수 있다는 것을 의미한다. 또한 DELPH-IN이 배포한 트리뱅크는 그래머를 개발하고 테스트하는 것은 물론, 파싱(또는 생성 시 실현) 시 그럴듯한 해석을 결정할 수 있는 순위 모델을 양성하는 데 사용된다.
엔주는 일본 도쿄대학 츠지이 연구소가 개발한 영어에 대한 자유이용 가능한 광범위의 확률론 HPSG 파서다.[21]
참고 항목
참조
- ^ "HPSG".
- ^ 폴라드, 칼 그리고 이반 A. 1987. 정보 기반 구문 및 의미론. 제1권. 기초 CLSI 강의 노트 13.
- ^ a b 폴라드, 칼; 이반 A. 사그(1994) 머리 중심 구문 구조 문법. 시카고: 시카고 대학 출판부.
- ^ 사그, 이반 A. 1997. 영어 상대 조항 구성[permanent dead link]. 언어학 저널 . 33.2: 431-484
- ^ 사그, 이반 A; 토마스 와소 & 에밀리 벤더 (2003). 통사론: 형식적인 도입. 2부. 시카고: 시카고 대학 출판부.
- ^ 바벨 시스템: HPSG 인터랙티브
- ^ 코어그램 프로젝트
- ^ 베를리그람
- ^ 댄그램
- ^ 중국어
- ^ 말티즈
- ^ 페르시아어
- ^ DELPH-IN: 오픈 소스 딥 프로세싱
- ^ 영어 자원 문법과 어휘론
- ^ 베르톨트 크라이즈만
- ^ JacyTop - HPSG(DELPH-IN)를 사용한 심층 언어 처리
- ^ DELPH-IN PET 파서
- ^ 에이스: 응답 제약 엔진
- ^ 문법 공학을 찬성하다
- ^ 코페스타케, A, 플리킹, D, 폴라드, C, & Sag, I. A. (2005) 최소 재귀 의미론: 소개. 언어 및 계산에 관한 연구, 3(2-3), 281-332.
- ^ 츠지랩: Enju 파서 홈 페이지 웨이백 머신에 보관된 2010-03-07 (2009년 11월 24일 회수)
추가 읽기
- 칼 폴라드, 이반 A. 사그(1987년): 정보 기반 구문 및 의미론. 제1권: 기초. 스탠포드: CSLI 간행물.
- 칼 폴라드, 이반 A. Sag(1994): 머리 중심 구문 구조 문법. 시카고: 시카고 대학 출판부. ([1])
- 이반 A. 사그, 토마스 와소, 에밀리 M. 벤더(2003): 통사론: 정식 서론, 제2판. 시카고: 시카고 대학 출판부. ([2])
- Levine, Robert D.; W. Detmar Meurers (2006). "Head-Driven Phrase Structure Grammar: Linguistic Approach, Formal Foundations, and Computational Realization" (PDF). In Keith Brown (ed.). Encyclopedia of Language and Linguistics (second ed.). Oxford: Elsevier. Archived from the original (PDF) on 2008-09-05. Retrieved 2008-03-07.
- Müller, Stefan (2013). "Unifying Everything: Some Remarks on Simpler Syntax, Construction Grammar, Minimalism and HPSG". Language. 89 (4): 920–950. doi:10.1353/lan.2013.0061.
외부 링크
- Stanford HPSG 홈페이지 – 연간 HPSG 컨퍼런스의 온라인 진행 포함
- 오하이오 주 HPSG 홈페이지
- 머리구조의 문법에 관한 국제회의
- HPSG 문법 개발을 위한 DELPH-IN 네트워크
- HPSG 기본 개요
- HPSG와 대안의 비교 및 역사적 관점
- HPSG 간행물 목록
- AVM 도면을 위한 LaTeX 패키지 – 문서 포함