연산자 문법
Operator grammar연산자 문법은 언어가 어떻게 정보를 전달하는지 설명하는 인간 언어의 수학 이론이다. 이 이론은 젤리그 해리스의 생애 연구의 정점이며, 지난 세기 말에 주요 출판물들이 있다. 연산자 문법에서는 각 인간 언어가 단어의 통사적 특성과 의미적 특성을 모두 다른 단어에 대해 순수하게 확립하는 자기 조직적 시스템이라고 제안한다. 따라서 언어의 규칙을 규정하는 데 외부 시스템(금속 언어)이 필요하지 않다. 대신에, 대부분의 사회적 행동이 그렇듯이, 이러한 규칙들은 이용에 대한 노출과 참여를 통해 학습된다. 이 이론은 언어가 점차 진화하여, 각각의 연속적인 세대가 새로운 복잡성과 변화를 도입한다는 사상과 일치한다.
연산자 문법은 세 가지 보편적 제약조건을 제시한다: 의존성(확실한 단어는 발음을 형성하는 다른 단어의 존재에 따라 달라진다), 가능성(단어와 그 의존성의 일부 조합은 다른 단어보다 더 가능성이 높다), 감소(높은 조합의 단어들은 더 짧은 형태로 축소될 수 있고, 때로는 완전히 생략될 수도 있다.) 이러한 것들이 함께 언어 정보의 이론을 제공한다: 의존성은 술어-주장 구조를 형성한다; 가능성은 뚜렷한 의미를 만들어낸다; 감소는 의사소통을 위한 콤팩트한 형태를 허용한다.
의존
연산자 문법의 기본 메커니즘은 의존성 제약이다: 특정 단어(운영자)는 하나 이상의 단어(논의)가 발음으로 존재할 것을 요구한다. 존이 부츠를 신는 문장에서, 운영자는 존과 부츠와 같은 두 가지 주장을 필요로 한다. (이러한 종속성의 정의는 그 주장이 사업자에게 의존한다고 하는 다른 종속성 문법과는 다르다.)
각 언어에서 단어 사이의 종속성 관계는 운영자의 허용 가능한 인수가 종속성 요구조건의 관점에서 정의되는 통사적 범주를 야기한다. 클래스 N은 다른 단어의 존재를 요구하지 않는 단어(예: 존, 부츠)를 포함한다. 클래스N O는 타입 N 클래스 O의NN 정확히 한 단어를 필요로 하는 단어(예: 스텀블)를 포함한다. 클래스OO O는 타입 N 클래스 O의 두 단어를 필요로 하는 단어(예: 마모)를 포함한다. 클래스 O는 존이 부츠를 신기 때문에 스텀블링하는 것처럼 타입 O의 두 단어를 필요로 하기 때문이다. 그 밖에 OO(예: 가능), O(예NNN: 퍼트), OON(예: 포함), ONO(예: know), ONNO(예: 질문), O(예NOO: 속성) 등이 있다.
연산자 문법의 범주는 범용적이며, 단어의 다른 단어와 어떻게 관련되는가의 관점에서 순수하게 정의되며, 명사, 동사, 형용사, 부사, 전치사, 접속사 등과 같은 외부 범주의 집합에 의존하지 않는다. 각 단어의 종속성 특성은 용법을 통해 관찰할 수 있으며 따라서 학습이 가능하다.
우도
종속성 제약조건은 적절한 클래스의 어떤 단어가 주어진 운영자에 대한 주장이 될 수 있는 구조(syntax)를 만든다. 가능성 제약은 일부 연산자/인수 결합을 다른 연산자보다 더 가능성 있게 함으로써 이 구조에 추가적인 제약을 가한다. 따라서 존은 존보다 모자를 쓰고 눈을 쓰고, 존은 휴가를 가는 것보다 더 잘 쓴다. 우도 제약조건은 각 단어를 논쟁으로 삼을 수 있는 단어나 논쟁으로 삼을 수 있는 단어의 관점에서 정의함으로써 의미(항문)를 창조한다.
각각의 단어들은 그것의 선택이라고 불리는 그것이 관찰된 독특한 단어들을 가지고 있다. 단어의 일관성 있는 선택은 의존 관계가 평균 가능성보다 높은 단어 집합이다. 뜻이 비슷한 단어들은 일관성 있는 선택이 비슷하다. 의미에 대한 이러한 접근방식은 단어가 의미하는 바를 정의하기 위해 외부 시스템이 필요하지 않다는 점에서 스스로 조직화된다. 대신에, 그 단어의 의미는 화자의 집단 내에서 그것의 용도에 의해 결정된다. 자주 사용하는 패턴은 관찰할 수 있고 따라서 학습할 수 있다. 새로운 단어들은 언제든지 소개될 수 있고 용법을 통해 정의된다.
이러한 의미에서 링크 문법은 단어들의 연계가 전적으로 문맥에 의해 결정되며, 각 선택에는 로그 우도가 할당된다는 점에서 일종의 연산자 문법이라고 볼 수 있다.
축소
감소 제약조건은 연산자와 인수의 높은 가능성 조합에 작용하고 보다 컴팩트한 형태를 만든다. 어떤 축소는 말에서 단어를 완전히 생략할 수 있게 한다. 예를 들어, 나는 존이 올 것이라고 예상한다. 왜냐하면 나는 존이 올 가능성이 매우 높기 때문이다. 존이 부츠를 신고, 존이 모자를 쓰고 있는 문장은 존이 부츠와 모자를 쓰고 있는 것으로 축소될 수 있는데, 이는 운영자 밑에 있는 존의 첫 번째 주장이 반복되고 가능성이 높기 때문이다. 존은 어떤 운영자 밑에서 일이 일어날 가능성이 높기 때문에 사물을 존이 읽는 것으로 줄일 수 있다고 읽는다.
어떤 감소는 어휘를 더 짧은 형태로 줄여 대명사, 접미사, 접두사(모르폴로지)를 만든다. 존은 장화를 신고 존은 모자를 쓰고, 존은 장화를 신고, 존은 모자를 쓰고, 존의 대명사는 존의 축소된 형태다. 접미사와 접두사는 자유롭게 발생하는 다른 단어 또는 이들의 변형을 추가하여 얻을 수 있다. 존은 호감을 받을 수 있다. 존은 호감이 간다. 존은 사려가 깊다. 존은 생각에 가득 차서, 존은 전쟁에 반대한다.
수식어는 형용사, 부사, 전치사구, 종속절 등을 발생시키는 이러한 종류의 몇 가지 감소의 결과물이다.
- 존은 부츠를 신는다. 부츠는 가죽(세미콜론 조작자가 결합한 두 문장) →
- 존은 가죽으로 된 부츠를 신는다(상대 대명사에 대한 반복명사의 감소) →
- 존은 가죽 부츠를 신는다(고우도 구절의 생략) →
- John은 가죽 부츠를 신는다. (높은 확률 연산자의 생략, 짧은 수식어를 명사의 왼쪽으로 전환)
각각의 언어는 독특한 축소를 가지고 있다. 예를 들어, 어떤 언어들은 형태학을 가지고 있고 어떤 언어들은 그렇지 않다; 어떤 언어들은 짧은 수식어를 바꾸고 어떤 언어들은 그렇지 않다. 언어의 각 단어는 특정한 종류의 감소에만 참여한다. 단, 각 경우에 감소된 자료는 주어진 연산자/논의 조합에서 가능한 것을 알고서 재구성할 수 있다. 한 단어의 종속성과 우도 특성을 배우듯이, 각 단어가 참여하는 감소는 관찰할 수 있고 따라서 학습할 수 있다.
정보
연산자 문법 축소의 중요성은 축소된 형식을 포함하는 문장과 그렇지 않은 문장(기본문장)을 구분하는 것이다. 모든 감소는 파라프레이즈로, 그들은 어떤 정보도 제거하지 않기 때문에, 단지 문장을 더 컴팩트하게 만들 뿐이다. 따라서 기본 문장은 언어의 모든 정보를 포함하고 축소된 문장은 이러한 변형이다. 기본 문장은 수식어가 없는 간단한 단어들로 구성되어 있으며, 주로 붙임성이 없는 단어들로 구성된다. 예를 들어, 눈이 내리고 양이 풀을 먹는다는 것을 알고 있고, 양이 눈을 먹는다는 것을 알고 있다.
문장의 각 연산자는 자신의 주장으로 발생할 가능성에 따라 정보에 기여한다. 기대치가 높은 조합은 낮은 정보를 가지고 있고, 드물게 높은 정보를 가지고 있다. 연산자의 정확한 기여는 높은 빈도로 발생하는 단어 집합인 연산자의 선택에 의해 결정된다. 논쟁은 첫 번째 또는 두 번째 논쟁 위치에서 높은 가능성을 가지고 나타날 수 있는 운영자에 따라 의미가 다르다. 예를 들어, 눈은 가을의 첫 번째 주장으로 예상되지만 먹는 것에 대한 주장은 아닌 반면, 그 반대는 양에 대한 사실이다. 마찬가지로, 연산자는 자신이 선택한 주장과 이를 선택하는 연산자가 다를 정도로 의미에 차이가 있다.
연산자 문법은 문장이 전달하는 정보가 각 주장과 연산자의 기여의 축적이라고 예측한다. 주어진 단어가 새로운 문장에 추가하는 정보의 증가는 이전에 어떻게 사용되었는지에 따라 결정된다. 결과적으로, 새로운 사용법은 단어와 관련된 정보 내용을 늘리거나 변경한다. 이 과정은 고주파수 사용법에 기초하기 때문에 시간이 지날수록 말의 의미는 비교적 안정적이지만 언어 공동체의 필요에 따라 바뀔 수 있다.
참고 문헌 목록
- Harris, Zellig (1982), A Grammar of English on Mathematical Principles, New York: John Wiley and Sons, ISBN 0-471-02958-0
- Harris, Zellig (1988), Language and Information, New York: Columbia University Press, ISBN 0-231-06662-7
- Harris, Zellig (1989), The Form of Information in Science: Analysis of an immunology sublanguage, Springer, ISBN 90-277-2516-0
- Harris, Zellig (1991), A Theory of Language and Information: A Mathematical Approach, Oxford University Press, USA, ISBN 0-19-824224-7