스키마 독립 데이터베이스

Schema-agnostic databases

스키마 불가지론 데이터베이스 또는 어휘 독립 데이터베이스는 사용자가 데이터의 표현으로부터 추상화되도록 지원하는 것을 목표로 하며, 쿼리와 데이터베이스 사이의 자동 의미 매칭을 지원한다.스키마 애그노스티시즘은 사용자 용어와 구조로 발행된 쿼리를 데이터 집합 어휘에 자동으로 매핑하는 데이터베이스의 속성이다.

데이터베이스 스키마의 크기와 의미 이질성의 증가는 구조화된 데이터를 쿼리하고 검색하는 사용자들을 위한 새로운 요구사항을 가져온다.이 규모에서 데이터 소비자가 데이터를 조회하기 위해 데이터의 표현을 숙지하는 것은 실현 불가능한 일이 될 수 있다.이 논의의 중심에는 사용자와 데이터베이스 간의 의미적 격차가 있는데, 데이터의 규모와 복잡성이 커질수록 더욱 중심이 된다.

설명

데이터 환경이 여러 데이터 소스의 데이터 소비로 발전하고 스키마의[1][2][3] 스키마 크기, 복잡성, 동적성분산(SCoDD)의 증가로 인해 현대 데이터 관리의 복잡성이 증대된다.SCoDD 추세는 사용자와 애플리케이션이 다른 의미론적 가정과 사용 컨텍스트에 따라 독립적인 데이터 소스에 의해 생산된 보다 완전한 데이터에 대한 요구를 갖는 빅 데이터 시나리오에서 중심 데이터 관리 문제로 대두되는데, 이는 시맨틱데이터 애플리케이션의 전형적인 시나리오다.

이기종 데이터 환경의 방향으로 데이터베이스의 진화는 구조화된 쿼리, 키워드 기반 검색 및 시각적 쿼리 시스템과 같은 기존 데이터 접근성 방법 뒤에 숨겨진 가용성, 기호학 및 의미론적 가정에 강하게 영향을 미친다.수백만 개의 동적으로 변화할 수 있는 속성을 포함하고 있는 스키마 없는 데이터베이스에서는, 일부 사용자가 데이터베이스를 쿼리하기 위해 '스케마'나 어휘를 인식하는 것이 불가능해진다.이 규모에서, 구조화된 질의를 구축하기 위해 스키마를 이해하려는 노력은 금지될 수 있다.

스키마 독립 쿼리

스키마 불가지론 쿼리는 사용자가 데이터베이스의 표현(구성표)을 이해하지 않고도 복잡한 정보 요구를 만족시킬 수 있도록 하는 구조화된 데이터베이스에 대한 쿼리 접근법으로 정의할 수 있다.마찬가지로, Tran 외 연구진은 이를 "데이터의 기초가 되는 스키마를 사용자가 알 필요가 없는 검색 접근법"으로 정의한다.[4]데이터베이스를 통한 키워드 기반 검색과 같은 접근방식은 사용자가 구조화된 쿼리를 사용하지 않고도 데이터베이스를 쿼리할 수 있게 한다.그러나 Tran 외 연구진이 논의한 바와 같이: "이러한 시점으로부터 사용자는 복잡한 정보 요구를 해결하기 위해 추가적인 탐색과 탐색을 해야 한다.단순 니즈에 초점을 맞춘 웹에서 사용되는 키워드 검색과 달리 여기에 정교하게 기술된 키워드 검색은 보다 복잡한 결과를 얻기 위해 사용된다.단일 자원 집합 대신 복잡한 자원 집합과 그 관계를 계산하는 것이 목표다."

데이터베이스를 통한 자연어 인터페이스(NLI) 지원 접근법의 개발은 스키마 불가지론 질의의 목표를 지향했다.보완적으로, 키워드 검색에 기반한 일부 접근방식은 보다 복잡한 정보 요구를 표현하는 키워드 기반 쿼리를 목표로 한다.다른 접근방식은 스키마 제약이 완화될 수 있는 데이터베이스에 대한 구조화된 질의의 구성을 탐구했다.이러한 모든 접근법(자연어, 키워드 기반 검색 및 구조화된 쿼리)은 질의와 데이터 간의 유연한 의미 매칭을 지원하는 문제를 다루는데 있어 서로 다른 수준의 정교함을 목표로 삼았는데, 이는 의미적 관심의 완전한 부재에서 보다 원칙적인 의미 모델에 이르기까지 다양하다.스키마 애그노스티즘에 대한 요구는 구조화된 데이터에 대한 의미 검색과 자연어 쿼리 시스템 전반에 걸쳐 암묵적인 요구조건이 되어 왔지만, 그것은 개념으로서 그리고 현대의 데이터베이스 관리 시스템에 필요한 요구조건으로서 충분히 개별화되지 못하고 있다.최근의 작품들은 스키마 불가지론적 질의에 관련된 의미적 측면을 정의하고 모델링하기 시작했다.[1][5][6]

스키마 독립형 구조 쿼리

구조화된 표준(예: SQL, SPARQL)의 구문에 따른 스키마 구분 없는 쿼리로 구성된다.연산자의 구문과 의미론은 유지되는 반면, 다른 용어는 사용된다.

예 1

선택 ?y { BillClinton has Daughter ?x . ?x warendedTo?y . }

데이터 집합 어휘에서 다음 SPARQL 쿼리에 매핑할 항목:

접두사 : <http://dbpedia.org/resource/> 접두사 dbpedia2: <http://dbpedia.org/property/> 접두사 dbpedia.: <http://dbpedia.org/ontology/> 접두사 스컹크: <http://www.w3.org/2004/02/skos/core#> 접두사 dbo.: <http://dbpedia.org/ontology/>  선택   ?y  {  :빌_클린턴 dbpedia.:어린아이의 ?x .  ?x dbpedia2:배우자 ?y .  } 

예 2

선택   ?x {          ?x isa  .          ?x 에 의해 윌리엄_골드먼 .          ?x has_pages ?p .          필터 (?p > 300)   } 

데이터 집합 어휘에서 다음 SPARQL 쿼리에 매핑할 항목:

접두사 rdf.: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 접두사 : <http://dbpedia.org/resource/> 접두사 dbpedia2: <http://dbpedia.org/property/> 접두사 dbpedia.: <http://dbpedia.org/ontology/> 선택 ?x {          ?x rdf.:타자를 치다 dbpedia.: .          ?x dbpedia2:저자 :윌리엄_골드먼 .           ?x dbpedia.:페이지 수 ?p . 필터(?p > 300) } 

스키마 독립 키워드 쿼리

키워드 쿼리를 사용하는 스키마 독립형 쿼리로 구성된다.이 경우 연산자의 구문과 의미론은 구조화된 쿼리 구문과 다르다.

"빌 클린턴 딸 결혼"
"윌리엄 골드만 책 300쪽 이상"

의미 복잡성

2016년을 기점으로 스키마 불가지론 쿼리의 개념은 주로 학계를 중심으로 개발되었다.스키마 불가지론 쿼리 시스템의 대부분은 데이터베이스나 시멘틱 웹을 통해 자연 언어 인터페이스의 맥락에서 조사되었다.[7]이 작품들은 크고 이질적이며 스키마가 없는 데이터베이스에 대한 의미론적 구문 분석 기법의 적용을 탐구한다.좀 더 최근에는, 스키마 불가지론적 질의 시스템과 데이터베이스 개념의 개별화가 문헌 내에 더욱 뚜렷하게 나타나고 있다.[1][5][6]Freitas 등은 스키마 불가지론적 질의 매핑의 의미적 복잡성에 대한 확률론적 모델을 제공한다.[8]

참조

  1. ^ a b c A. Freitas, "대규모 스키마 데이터베이스에 대한 Schema-Agnantic 쿼리: 배포 의미론적 접근방식" PhD Statement, 2015
  2. ^ Pat Helland, ["데이터가 너무 많으면 '좋다'면 충분하다"], Communication.ACM 54(6): 40–47, 2011.
  3. ^ M. L. Brodie와 J. T. 류, ["정보 생태계 시대 관계 기술의 힘과 한계"], 키노트, On The Move Federated Conference, On The Move Conference, On The Move Federated Conference, 그리스 헤라클리온, 2010년 10월 25–29일.
  4. ^ T. Tran, T. Mathaess, P. Haase, ["키워드 중심 스키마 불가지론 검색의 유용성 – 키워드 검색, 면면 검색, 질의 완료 및 결과 완료의 비교 연구"], 제7회 확장 의미 웹 컨퍼런스(ESWC'10)의 진행 중.2010년 6월, 그리스 헤라클리온.
  5. ^ a b A. Freitas, J. C. Pereira Da Silva, E. Curry, "On the Semantic Mapping of Schema-agnostic Queries: A Preliminary Study", Workshop of the Natural Language Interfaces for the Web of Data (NLIWoD), 13th International Semantic Web Conference (ISWC), Rival del Garda, 2014.
  6. ^ a b S. Bischof, M. Kroetzsch, A. Polleres, S. Rudolph, ["Schema-Agnistic Query Rewriting in SPARQL 1.1"], 제13회 국제 의미론 웹 컨퍼런스 진행 중.2014년 스프링거.
  7. ^ Unger 등, ["연결된 데이터에 대한 질문 답변 소개"], 2014년 추론 웹 서머 스쿨의 진행 중, 2014년
  8. ^ A. Freitas, J. E. S. Handschuh, E. Curry, "쿼리는 얼마나 어려운가? 2015년 제11차 국제 계산 의미론적 회의(IWCS, International Conference on Computing Semantics, IWCS, International Conference, In Procedures of Schema-Agnistic Queries) 의미론적 복잡성 측정" 런던,