시간적 표현
Temporal expressions텍스트의 시간적 표현은 시간을 나타내는 토큰(단어, 숫자, 문자)의 시퀀스로서, 시점, 지속시간 또는 빈도를 나타낸다. 예:
- 지정 시점:
그는 1980년 5월 6일에 태어났다.
- 기간:
그 쇼는 7분 동안 계속되었다.
- 주파수:
펌프는 물을 2시간마다 순환시킨다.
처음에 일시적 표현은 명명된 실체의 한 유형으로 간주되었고 그 식별은 명명된 실체 인식 과제의 일부였다. 2004년 자동 내용 추출 프로그램 이후 별도의 과제가 식별되어 TERN(Temporary Expression Acception Incognition and Normalization)이라고 불린다. 이제 Timex 평가는 두 가지 주요 시간 주석 과제에서 평가된다. TempEval과 i2b2 모두 TimeML-level TIMEX3 표준을 선호한다.[1]
접근
NER 시스템과 마찬가지로 시간적 표현 태거도 언어 문법 기반 기법이나 통계적 모델을 사용하여 만들어졌다. 수작업으로 만든 문법 기반 시스템은 일반적으로 더 나은 결과를 얻지만, 경험이 풍부한 언어학자들의 수개월의 작업 비용으로 얻어냈다. 현재 그러한 시스템들이 많이 사용되고 있기 때문에,[2][3][4] 시간적 표현 인식기를 처음부터 만드는 것은 일반적으로 바람직하지 않은 노력의 중복이다. 대신에, 현재의 접근법은 새로운 timex 하위 분류에 초점을 맞추고 있다.[5]
통계시스템은 일반적으로 수동으로 주석 처리된 많은 양의 훈련 데이터가 필요하며 일반적으로 인식 과제에만 적용된다(해석 단계의 특정 모호성을 해결하기 위해 머신러닝 알고리즘을 사용하여 수행된 작업이 있기는 하지만).[6][7]
메모들
- ^ TIMEX3 timeml.org을 참조하십시오.
- ^ Strötgen, Jannik; Michael Gertz (2010). "HeidelTime: High quality rule-based extraction and normalization of temporal expressions". Proceedings of the 5th International Workshop on Semantic Evaluation. ACL.
- ^ Llorens, Hector; Leon Derczynski; Robert Gaizauskas; Estela Saquete (2012). "TIMEN: An Open Temporal Expression Normalisation Resource". LREC. ACL.
- ^ Filannino, Michele; Gavin Brown; Goran Nenadic (2013). "ManTIME: Temporal identification and normalization in the TempEval-3 challenge". Proceedings of the 7th International Workshop on Semantic Evaluation. ACL.
- ^ Brucato, Matteo; Leon Derczynski; Hector Llorens; Kalina Bontcheva; Christian S. Jensen (2013). "Recognising and Interpreting Named Temporal Expressions". Proceedings of the International Conference on Recent Advances in Natural Language Processing. ACL.
- ^ 예를 들어, 안, 판 랑트위크 & 드 리케 2007을 보라.
- ^ Angeli, Gabor; Christoper Manning; Daniel Jurafsky (2012). "Parsing time: Learning to interpret time expressions". Proceedings of NAACL. ACL: 446.
참조
- Ahn, David; van Rantwijk, Joris; de Rijke, Maarten (2007), "A Cascaded Machine Learning Approach to Interpreting Temporal Expressions" (PDF), Proceedings of Human Language Technologies: The Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2007), ACL
- Filannino, Michele; Brown, Gavin; Nenadic, Goran (2013), "ManTIME: Temporal identification and normalization in the TempEval-3 challenge" (PDF), Proceedings of the 7th International Workshop on Semantic Evaluation, ACL