자동 분류법 구성

Automatic taxonomy construction

자동 분류 체계 구축(ATC)은 소프트웨어 프로그램을 사용하여 말뭉치라고 불리는 텍스트 본체로부터 분류 분류를 생성하는 것이다.ATC는 자연어 처리의 한 분야로, 다시 인공지능의 한 분야다.

분류법(또는 비과세 분류법)은 분류 체계, 특히 사물이 집단이나 유형으로 정리되는 계층적 분류법이다.[1][2][3][4][5][6]무엇보다도, 분류법은 도서관 분류 시스템이나 검색 엔진 분류 체계와 같은 지식(문서, 기사, 동영상 등으로 저장됨)을 체계화하고 색인화하는 데 사용되어 사용자가 더 쉽게 찾고 있는 정보를 찾을 수 있도록 할 수 있다.많은 분류법은 계층 구조(따라서 본질적인 트리 구조를 가지고 있음)이지만 모두 다 그런 것은 아니다.

분류법을 수동으로 개발하고 유지하는 것은 분류법의 영역(범위, 주제 또는 분야)에 대한 친숙성이나 전문지식을 포함하여 상당한 시간과 자원을 필요로 하는 노동집약적인 작업으로, 비용을 견인하고 그러한 프로젝트의 범위를 제한한다.또한, 도메인 모델러들은 의도치 않게라도 필연적으로 분류학으로 그들 나름대로의 관점을 가지고 있다.ATC는 이러한 문제를 피하고 한계를 제거하기 위해 인공지능 기술을 사용하여 도메인의 분류법을 신속하게 생성한다.

접근

ATC에는 몇 가지 접근방식이 있다.한 가지 접근법은 말뭉치의 패턴을 탐지하기 위해 규칙을 사용하고 저포니 같은 관계를 추론하기 위해 그러한 패턴을 사용하는 것이다.다른 접근법은 베이지안 회의인공신경망과 같은 기계 학습 기법을 사용한다.[7]

키워드 추출

분류법을 구축하는 한 가지 접근방식은 키워드 추출을 사용하여 도메인에서 자동으로 키워드를 수집한 다음, 키워드 간의 관계를 분석한 후(하이포니미, 이하 참조), 그런 관계를 바탕으로 분류법으로 배열하는 것이다.

하이포니와 is-a 관계

ATC 프로그램에서 가장 중요한 과제 중 하나는 단어들 사이의 하이퍼니임과 저포니임 관계의 발견이다.텍스트 본문에서 그렇게 하는 한 가지 방법은 "a"와 "so"와 같은 특정 구절을 검색하는 것이다.

언어학에서는 is-a 관계를 hyponymy라고 부른다.범주를 설명하는 단어를 하이퍼니움이라고 하고 범주의 예인 단어들을 저포니움이라고 한다.예를 들어, 는 하이퍼니엄이고 피도는 그 하이퍼니엄 중 하나이다.한 마디는 저포니임과 하이퍼니임 둘 다 될 수 있다.그래서 포유류의 대명사고 피도의 하이퍼니엄이기도 하다.

분류법은 종종 (수학 언어 "부분집합"에서) 그 위 수준보다 각 수준이 더 구체적인 (수학 언어 "부분집합") 계층인 is 계층 구조로 표현된다.예를 들어, 기본적인 생물 분류 체계에는 동물의 하위 집합포유류와 포유류의 하위 집합와 고양이와 같은 개념이 있을 것이다.이러한 종류의 분류법은 특정 개체가 개념의 인스턴스로 간주되기 때문에 is-a 모델이라고 불린다.예를 들어, 피도는 개념의 개와 솜털고양이의 예다.[8]

적용들

ATC는 검색 엔진에 대한 분류 체계를 구축하고 검색 결과를 개선하기 위해 사용될 수 있다.

ATC 시스템은 온톨로지 학습(자동 온톨로지 구축이라고도 함)의 핵심 구성요소로서, 보험, 금융 등 도메인의 대규모 온톨로지를 자동으로 생성하는 데 이용되어 왔다.워드넷과 같은 기존의 대형 네트워크를 더욱 완전하고 일관성 있게 개선하는 데도 활용됐다.[9][10][11]

ATC 소프트웨어

기타 이름

자동 분류법 구성의 기타 이름에는 다음이 포함된다.

  • 분류법 생성
  • 자동 분류법 생성
  • 분류학
  • 자동 분류학 학습
  • 분류법 추출
  • 자동 분류법 추출
  • 분류법 건물
  • 자동 분류법 건물
  • 분류유도
  • 자동분류유도
  • 의미분류유도

참고 항목

참조

  1. ^ "Taxonomy". 10 October 2021.
  2. ^ "Taxonomy Definition & Meaning". Dictionary.com. Retrieved 2022-05-13.
  3. ^ "What is Taxonomy?". 14 August 2017.
  4. ^ "TAXONOMY Meaning & Definition for UK English". Lexico.com. Retrieved 2022-05-13.
  5. ^ "What is Taxonomy?". 20 August 2003.
  6. ^ "TAXONOMY (Noun) definition and synonyms Macmillan Dictionary".
  7. ^ Neshati, Mahmood; Alijamaat, Ali; Abolhassani, Hassan; Rahimi, Afshin; Hoseini, Mehdi (2007). "Taxonomy Learning Using Compound Similarity Measure". IEEE/WIC/ACM International Conference on Web Intelligence (WI'07). pp. 487–490. doi:10.1109/WI.2007.135. ISBN 978-0-7695-3026-0.
  8. ^ Brachman, Ronald (October 1983). "What IS-A is and isn't. An Analysis of Taxonomic Links in Semantic Networks". IEEE Computer. 16 (10): 30–36. doi:10.1109/MC.1983.1654194. OSTI 5363562. S2CID 16650410.
  9. ^ Velardi, Paola; Faralli, Stefano; Navigli, Roberto (10 October 2012). "OntoLearn Reloaded: A Graph-based Algorithm for Taxonomy Induction". Computational Linguistics. Association for Computational Linguistics. CiteSeerX 10.1.1.278.5674.
  10. ^ Liu, Xueqing; Song, Yangqiu; Liu, Shixia; Wang, Haixun (12–16 August 2012). "Automatic Taxonomy Construction from Keywords" (PDF). KDD '12. ACM: 1433. doi:10.1145/2339530.2339754. ISBN 9781450314626. S2CID 9100603. Retrieved 7 March 2017.
  11. ^ Snow, Rion; Jurafsky, Daniel; Ng, Andrew. "Semantic Taxonomy Induction from Heterogenous Evidence" (PDF). Stanford University. Retrieved 8 March 2017. {{cite journal}}:Cite 저널은 필요로 한다. journal=(도움말)

추가 읽기

외부 링크