텍스트 포함
Textual entailment자연어 처리에서의 텍스트 수반(TE)은 텍스트 단편 간의 방향 관계입니다.이 관계는 한 텍스트 조각의 진실이 다른 텍스트에서 나올 때마다 유지됩니다.TE 프레임워크에서 부가 텍스트와 부가 텍스트는 각각 텍스트(t)와 가설(h)로 불린다.Textual 세습 재산은 순수 논리적 세습 재산 –이 좀 더 느긋하게 정의:"t가 수반하는 게 뭔지 h"(t⇒ h)만약, 일반적으로 인간을 읽지 않을래 그 h가장 유력한 사실이 있는지 추론할 것과 같지 않다.[1](또는:t⇒ h만일, 일반적으로 인간을 읽지 않은 제안 h에 의해 그 제안 expre에서 짜냈는가를 정당화 될 것이다.ssed by t)[2]이 관계는 "t가 h를 수반한다"고 해도 "h가 t를 수반한다"는 역의 [3][4]확실성이 훨씬 낮기 때문에 방향적이다.
이 관계가 유지되는지 여부를 결정하는 것은 비공식적인 작업이며, 때로는 형식적인 의미론의 공식 작업(일반적으로 엄격한 조건을 만족시키는 것은 덜 엄격한 조건의 만족을 의미함)과 겹친다. 또한 텍스트적 수반은 부분적으로 단어 수반을 가정한다.
예
텍스트의 수반은 세 가지 다른 [5]관계의 예를 들어 설명할 수 있습니다.
양의 TE(텍스트는 가설을 수반한다)의 예는 다음과 같습니다.
- text: 당신이 가난한 사람들을 돕는다면, 신은 당신에게 보답할 것입니다.
- 가설:가난한 사람에게 돈을 주는 것은 좋은 결과를 가져온다.
음의 TE(텍스트는 가설과 모순됨)의 예는 다음과 같습니다.
- text: 당신이 가난한 사람들을 돕는다면, 신은 당신에게 보답할 것입니다.
- 가설:가난한 사람에게 돈을 주는 것은 아무런 결과도 없다.
TE 이외의 예(텍스트는 포함되거나 모순되지 않음)는 다음과 같습니다.
- text: 당신이 가난한 사람들을 돕는다면, 신은 당신에게 보답할 것입니다.
- 가설:가난한 사람에게 돈을 주면 더 나은 사람이 될 것이다.
자연어의 모호성
자연어의 특징은 말하고 싶은 것을 표현하는 많은 다른 방법이 있다는 것이다: 하나의 텍스트에 여러 개의 의미가 포함될 수 있고 다른 텍스트에 의해 같은 의미가 표현될 수 있다.의미 표현의 이러한 다양성은 언어 모호성의 이중적인 문제로 볼 수 있다.이 두 가지가 합쳐지면 언어 표현과 의미 사이에 다대다 매핑이 발생합니다.바꿔쓰는 작업은 두 텍스트가 동일한 의미를 가질 때 인식하고 거의 동일한 정보를 전달하는 유사하거나 짧은 텍스트를 만드는 것입니다.텍스트의 수반은 비슷하지만[6] 단방향의 관계를 약화시킨다.텍스트 수반을 확립하기 위한 수학적 해법은 [4]관련된 텍스트의 몇 가지 방향적 유사성을 비교함으로써 이 관계의 방향적 특성에 기초할 수 있다.
접근
텍스트 수반은 텍스트의 의미 해석을 요구할 때 자연어 이해를 측정하며, 그 보편성 때문에 여전히 활발한 연구 분야로 남아 있다.단어 임베딩, 논리 모델, 그래픽 모델, 규칙 시스템, 컨텍스트 포커싱 및 기계 [6]학습과 같은 많은 접근법과 개선 방법이 고려되었다.실용적이거나 대규모 솔루션은 이러한 복잡한 방법을 피하고 대신 표면 구문이나 어휘 관계만 사용할 뿐 [3]정확도가 떨어집니다.그러나 최신 시스템조차 여전히 인간의 성능과는 거리가 멀다. 2016년 알고리즘이 [8]아직 90%를 달성하지 못한 반면, 연구 결과에 따르면 인간은 데이터셋에 95.25%의 시간 [7]동안 동의하는 것으로 나타났다.
적용들
질문 응답, 정보 추출, 요약, 복수 문서 요약 및 기계 번역 시스템의 평가와 같은 많은 자연 언어 처리 애플리케이션은 특정 목표 의미를 다른 텍스트 변형에서 추론할 수 있음을 인식할 필요가 있습니다.일반적으로 수반은 더 큰 시스템의 일부로 사용됩니다. 예를 들어 예측 시스템에서는 사소하거나 명백한 [9]예측을 걸러내기 위해 사용됩니다.
「 」를 참조해 주세요.
레퍼런스
- ^ 이도 다간, 오렌 글릭만, 베르나르도 마그니 PASCAL 인식 텍스트 수반 과제, 페이지 2 in: 퀴뇨네로 칸델라, J.; 다간, I.; 매그니, B.; 달체벅, F. (Eds)머신러닝의 과제 컴퓨터 과학 강의 노트, 제3944권, 177-190페이지, Springer, 2006.
- ^ Korman, Daniel Z.; Mack, Eric; Jett, Jacob; Renear, Allen H. (2018-03-09). "Defining textual entailment". Journal of the Association for Information Science and Technology. 69 (6): 763–772. doi:10.1002/asi.24007. ISSN 2330-1635. S2CID 46920779.
- ^ a b Dagan, I., O. 글릭맨. '확률론적 텍스트 수반: 언어 가변성의 일반 적용 모델링'의 '텍스트 이해 및 마이닝을 위한 학습 방법에 관한 PASCAL 워크숍(2004) 그르노블.
- ^ a b 타타르, D.방향 관계로서의 텍스트 포함
- ^ 컴퓨터 언어학 협회 Wiki 텍스트 포함 포털
- ^ a b Androutsopoulos, Ion; Malakasiotis, Prodromos (2010). "A Survey of Paraphrasing and Textual Entailment Methods" (PDF). Journal of Artificial Intelligence Research. 38: 135–187. arXiv:0912.3747. doi:10.1613/jair.2985. S2CID 9234833. Retrieved 13 February 2017.
- ^ Bos, Johan; Markert, Katja (1 January 2005). "Recognising Textual Entailment with Logical Inference" (PDF). Proceedings of the Conference on Human Language Technology and Empirical Methods in Natural Language Processing: 628–635. doi:10.3115/1220575.1220654. S2CID 10202504. Archived from the original (PDF) on 13 February 2017. Retrieved 13 February 2017.
- ^ Zhao, Kai; Huang, Liang; Ma, Mingbo (4 January 2017). "Textual Entailment with Structured Attentions and Composition". arXiv:1701.01126 [cs.CL].
- ^ Shani, Ayelett (25 October 2013). "How Dr. Kira Radinsky Used Algorithms to Predict Riots in Egypt". Haaretz. Retrieved 13 February 2017.