온톨로지 기반 데이터 통합
Ontology-based data integration온톨로지 기반 데이터 통합은 여러 이기종 소스의 데이터나 정보를 효과적으로 결합하기 위해 하나 이상의 온톨로지를 사용하는 것을 포함한다.[1]다중 데이터 통합 접근방식 중 하나이며 GAV(Global-As-View)로 분류될 수 있다.[2]온톨로지 기반 데이터 통합의 효율성은 통합 프로세스에 사용되는 온톨로지의 일관성 및 표현성과 밀접하게 관련되어 있다.
배경
여러 출처의 데이터는 여러 유형의 이질성으로 특징지어진다.흔히 다음과 같은 계층이 사용된다.[3][4][5]
- 구문 이질성: 데이터의 표현 형식 차이에서 기인한다.
- 개략적 또는 구조적 이질성: 데이터를 저장하는 기본 모델 또는 구조는 구조 이질성으로 이어지는 데이터 소스에서 서로 다르다.구조화된 데이터베이스에서 특히 나타나는 도식적인 이질성은 구조적 이질성의 한 측면이기도 하다.[3]
- 의미 이질성: 데이터의 '의미' 해석의 차이는 의미 이질성의 원천이다.
- 시스템 이질성: 서로 다른 운영 체제, 하드웨어 플랫폼의 사용으로 시스템 이질성이 발생함
온톨로지는, 명시적으로 정의된 개념과 이들을 연결하는 명명된 관계를 가진 표현의 형식 모델로서, 데이터 소스의 의미 이질성 문제를 다루기 위해 사용된다.생물정보학이나 바이오의학과 같은 영역에서, 온톨로지의 신속한 개발, 채택 및 공공 이용[1]은 데이터 통합 커뮤니티가 데이터와 정보의 의미적 통합을 위해 그것들을 활용할 수 있게 했다.
온톨로지의 역할
온톨로지는 이질적인 정보 시스템에서 실체를 명확하게 식별하고, 이러한 실체를 서로 연결하는 해당 명명된 관계의 주장을 가능하게 한다.특히 온톨로지는 다음과 같은 역할을 한다.
- 콘텐츠 탐색
- [1] 온톨로지에서는 온톨로지 내의 용어와 관계의 명시적 정의를 통해 여러 출처의 데이터를 정확하게 해석할 수 있다.
- 검증
- [1] 온톨로지에서는 여러 소스의 데이터를 통합하는 데 사용되는 매핑을 검증한다.이러한 매핑은 사용자가 지정하거나 시스템에 의해 생성될 수 있다.
데이터 통합에 온톨로지를 사용하는 접근 방식
온톨로지 기반 데이터 통합 애플리케이션에서 구현되는 3가지 주요 아키텍처가 있다.[1]
- 단일 온톨로지 접근 방식
- 단일 온톨로지(Ontology)는 시스템에서 글로벌 기준 모델로 사용된다.이것은 다른 접근법에 의해 시뮬레이션될 수 있는 가장 단순한 접근법이다.[1]SIMS는[6] 이 접근방식의 두드러진 예다.Research Cyc의 체계화된 지식 출처 통합 구성요소는 이 접근방식의 또 다른 두드러진 예다.[7][8] (제목 = Cyc를 활용하여 임상 연구자의 애드혹 쿼리에 대답).겔리쉬 택사노믹 사전-온톨로지 역시 이 접근법을 따른다.[9]
- 다중 온톨로지
- 각각의 개별 데이터 소스를 모델링하는 다중 온톨로지가 통합을 위해 결합하여 사용된다.그러나 이 접근법은 단일 온톨로지 접근법보다 더 유연하며, 다중 온톨로지 사이의 매핑을 생성해야 한다.온톨로지 매핑은 도전적인 이슈로 컴퓨터 과학 분야에서 많은 연구 노력의 초점이 되고 있다[2].OVERVER 시스템은[10] 이 접근법의 한 예다.
- 하이브리드 접근 방식
- 하이브리드 접근법은 공통의 최상위 어휘를 구독하는 다중 온톨로지의 사용을 포함한다.[11]최상위 어휘는 도메인의 기본 용어를 정의한다.따라서, 하이브리드 접근법은 공통 어휘가 존재하는 곳에서 통합을 위해 다중 온톨로지를 더 쉽게 사용할 수 있게 한다.
참고 항목
참조
- ^ a b c d e f H. Wache; T. Vögele; U. Visser; H. Stuckenschmidt; G. Schuster; H. Neumann; S. Hübner (2001). Ontology-Based Integration of Information A Survey of Existing Approaches. CiteSeerX 10.1.1.142.4390.
- ^ Maurizio Lenzerini (2002). Data Integration: A Theoretical Perspective (PDF). pp. 243–246.
- ^ a b A.P. Sheth (1999). "Changing Focus on Interoperability in Information Systems: From System, Syntax, Structure to Semantics". Interoperating Geographic Information Systems. M. F. Goodchild, M. J. Egenhofer, R. Fegeas, and C. A. Kottman (eds.), Kluwer Academic Publishers (PDF). pp. 5–30.
- ^ AHM02 자습서 5: 데이터 통합 및 조정, 기여자: B루다셔, 나.알틴타스, A.굽타, 엠 마톤, 알 마르시아노, 엑스 첸
- ^ "AHM02 Tutorial 5: Data Integration and Mediation". users.sdsc.edu. Retrieved 2017-11-23.
- ^ a b Y. Arens; C. Hsu; C.A. Knoblock (1996). Query Processing in sims information mediator (PDF).
- ^ http://www.cyc.com/content/semantic-knowledge-source-integration[데드링크]
- ^ "Archived copy". Archived from the original on 2010-12-31. Retrieved 2014-05-15.
{{cite web}}
: CS1 maint: 타이틀로 보관된 사본(링크) - ^ https://www.gellish.net
- ^ E. Mena; V. Kashyap; A. Sheth; A. Illarramendi (1996). OBSERVER: An Approach for Query Processing in Global Information Systems based on Interoperation across Pre-existing Ontologies (PDF).
- ^ Cheng Hian Goh (1997). Representing and Reasoning about Semantic Conflicts in Heterogeneous Information Systems (PDF).