바벨넷
BabelNet| 안정된 릴리스 | BabelNet 5.0 / 2021년 2월 |
|---|---|
| 운영 체제 | |
| 유형 | |
| 면허증. | Attribution-NonCommercial-ShareAlike 3.0 미리포트 |
| 웹 사이트 | babelnet |
BabelNet은 로마 [1][2]사피엔자 대학의 NLP 그룹에서 개발된 다국어 시멘틱 네트워크 및 온톨로지입니다.BabelNet은 Wikipedia를 영어에서 가장 인기 있는 컴퓨터 어휘인 WordNet과 연결함으로써 자동으로 생성되었습니다.통합은 자동 매핑을 사용하여 수행되며, 통계 기계 번역을 사용하여 리소스가 부족한 언어의 어휘 공백을 채웁니다.그 결과 많은 언어로 사전화되고 많은 양의 의미적 관계와 연결된 개념과 명명된 실체를 제공하는 백과사전입니다.무료 라이선스 워드넷, OmegaWiki, 영어 위키사전, Wikidata, FrameNet, VerbNet 등에 링크하여 어휘화와 정의를 추가합니다.WordNet과 마찬가지로 BabelNet은 서로 다른 언어의 단어들을 Babel synsets라고 불리는 동의어 세트로 그룹화합니다.각 Babel Synset에 대해 BabelNet은 WordNet과 Wikipedia에서 수집된 많은 언어로 짧은 정의(광택이라고 함)를 제공합니다.
BabelNet 통계 정보
2021년 4월[update] 현재 BabelNet (버전 5.0)은 500개 언어에 대응하고 있습니다.그것은 거의 2천만 개의 싱크로셋과 약 14억 개의 단어 감각을 포함하고 있다.각 Babel synset에는 언어당 평균 2개의 동의어가 포함되어 있습니다.즉, 단어 감각입니다.의미 네트워크는 WordNet의 모든 사전의미적 관계(하이퍼니엄과 하이포니엄, 머니엄과 홀로니엄, 반의어와 동의어 등 총 364,000개의 관계 가장자리)와 위키피디아로부터의 미특정 관계(총 13억 개의 가장자리)[1]를 포함한다.버전 5.0에서는 약 5100만 개의 이미지를 Babel Synset에 관련지어 SPARQL 엔드포인트를 통해 이용할 수 있는 자원의 [3]Lemon RDF 인코딩을 제공하고 있습니다.267만 개의 Synset에 도메인 라벨이 할당되어 있습니다.
적용들
BabelNet은 다국어 자연어 처리 애플리케이션을 지원하는 것으로 나타났습니다.BabelNet에서 사용할 수 있는 어휘화된 지식은 다음과 같은 최신 결과를 얻을 수 있는 것으로 나타났습니다.
경품 및 사례
BabelNet은 "다언어 어휘화된 시맨틱 네트워크와 이기종 데이터 소스를 활용한 온톨로지를 통해 언어 장벽을 극복한 획기적인 연구"로 META Prize 2015를 수상했다.
BabelNet은 웹에서 이용 가능한 혁신적이고 최신의 어휘 지식 자원의 새로운 시대에 대해 Time 잡지의[9] 기사에서 두드러지게 다루었습니다.
「 」를 참조해 주세요.
레퍼런스
- ^ R. 나발리, S. P. 폰제토BabelNet: 대규모 다국어 시멘틱 네트워크 구축.스웨덴, 웁살라, 2010년 7월 11-16일, 제48회 컴퓨터 언어학 협회 연차총회(ACL 2010), 페이지 216-225.
- ^ M. 어먼, F.세코니, D바넬라, J. 맥크레이, P. 치미아노, R. 네비게이션리다국어 데이터를 링크된 데이터로 표현: BabelNet 2.0의 경우.2014년 5월 26~31일 아이슬란드 레이캬비크에서 열린 제9회 언어 자원 및 평가 회의(LREC 2014) 주최자.
- ^ R. Naveli와 S. Ponzetto.2012년 바벨렐레이트! 시멘틱 관련성을 계산하기 위한 다국어 공동 접근법.캐나다 토론토, 제26회 AAAI 인공 지능 회의(AAAI 2012)의 대리, 페이지 108-114.
- ^ J. Camacho-Collados, M. T. Pilehvar, R.항해사NASARI: 의미론적으로 인식되는 항목의 표현에 대한 새로운 접근법.2015년 5월 31일부터 5월 5일까지 미국 콜로라도주 덴버, 컴퓨터 언어학 협회 북미 지부 총회(NAACL 2015)의 대리, 페이지 567-577.
- ^ R. Naveli와 S. Ponzetto.협력의 결실: 다국어 공동 단어 의미 명확화2012년 자연언어 처리 경험적 방법에 관한 컨퍼런스(EMNLP 2012), 한국 제주, 2012년 7월 12-14일, 페이지 1399-1410.
- ^ A. Moro, A. Raganato, R. Navigli엔티티 링크는 Word Sense 명확화: 2014-08년 TACL(Association for Computational Languageistics)의 웨이백 머신 트랜잭션에서 아카이브된 통합 접근 방식, 2, 페이지 231-244, 2014.
- ^ D. 쥬겐스, R. Navigli "It's All Fun and Games until Someone Annotates: Video Games with a Purpose for Linguistic Annotation" (PDF). Archived from the original on January 3, 2015. Retrieved 2015-01-03.
{{cite web}}: CS1 maint: 봇: 원본 URL 상태를 알 수 없음(링크), 컴퓨터 언어학 협회(TACL), 2, 페이지 449-464, 2014. - ^ Steinmetz, Katy(2016년 5월 12일).'현대사전의 정의'시간 187: 20-21