데이터 웨어하우스 어플라이언스
Data warehouse appliance컴퓨팅에서 데이터 웨어하우스 어플라이언스(DWA)라는 용어는 포스터 힌쇼가[1][2] (사전 구성이 아닌) 사용이 간편하고 작업 부하가 높은 빅데이터 분석과 발견을 위해 특별히 마케팅한 데이터 웨어하우스(DW)용 컴퓨터 아키텍처를 위해 만들었다. DWA는 서버, 스토리지, 운영 체제 및 데이터베이스의 통합 세트를 포함한다.
마케팅에서 용어는 사전 설치되고 미리 최적화된 하드웨어와 소프트웨어뿐만 아니라 특정 권장 하드웨어 구성에 쉽게 설치하거나 전체 시스템으로 사전 구성된 유사한 소프트웨어 전용 시스템을[3] 포함하도록 발전되었다.[4][5] 이러한 용어는 마케팅 용어로 기술 정의를 반영하지 않는다.
DWA는 고성능 빅데이터 분석을 위해 특별히 설계되었으며 사용이 간편한 패키지 시스템으로 제공된다. DW 어플라이언스는 테라바이트에서 페타바이트 사이의 데이터 볼륨에 대해 판매되고 있다.
기술
데이터 웨어하우스 어플라이언스(DWA)는 그 아키텍처를 엔터프라이즈 데이터 웨어하우스(EDW)와 같은 데이터 센터의 유사한 기계와 차별화하는 몇 가지 특성을 가지고 있다.
- DWA는 "계산 중심" 운영과 대조적으로 "데이터 중심" 운영에 최적화된 내부 구성요소를 매우 긴밀하게 통합한다. 후자는 CPU 수, 코어 및 네트워크 대역폭을 강조하는 경향이 있다.
- DWA는 사용과 설치에 사소한 것이다. 구성 요소의 "사전 구성"과 대조적으로 DWA는 구성 스위치나 옵션이 거의 없다. 이러한 옵션의 제거는 대형 시스템의 고장 원인 1위인 구성 오류를 현저히 감소시킨다.
- DWA는 빅데이터 분석에 최적화되어 있다. 이와는 대조적으로 이전의 아키텍처(병렬 아키텍처 포함)는 보조 작업으로서 데이터 및 지원 분석을 위한 범용 저장소로서 "기업 데이터 웨어하우스"에 초점을 맞췄다.
대부분의 DW 어플라이언스는 높은 질의 성능과 플랫폼 확장성을 제공하기 위해 MPP(Massive Parallel Processing) 아키텍처를 사용한다. MPP 아키텍처는 병렬로 실행되는 독립 프로세서 또는 서버로 구성된다. 대부분의 MPP 아키텍처는 각 서버가 자급자족적으로 작동하고 자신의 메모리와 디스크를 제어하는 "공유 없는 아키텍처"를 구현한다. DW 어플라이언스는 어플라이언스의 각 서버에 연결된 전용 Disk 저장 장치에 데이터를 배포한다. 이 배포를 통해 DW 어플라이언스는 각 서버의 데이터를 병렬로 검색하여 관계형 쿼리를 해결할 수 있다. 분할-통화 접근방식은 높은 성능을 제공하고 아키텍처에 새로운 서버가 추가됨에 따라 선형적으로 확장된다.
역사
데이터 웨어하우스 가전(Data warehouse equipment)은 네테자(Netezza)의 창시자인 [1][2]포스터 힌쇼(Poster Hinshaw)가 최초의 데이터 웨어하우스 어플라이언스를 만들 때, 힌쇼와 Netezza는 모델 204, 테라다타 등이 개발한 기반을 활용하여 비용 효율적이고 확장성이 뛰어난 모듈형 데이터베이스 시스템을 제공하여 소비자 분석을 효율적으로 처리하기 위한 새로운 범주를 개척했다.
MPP 데이터베이스 아키텍처들은 긴 혈통을 가지고 있다. 일부 사람들은 Teradata의 초기 제품을 최초의 DW 어플라이언스 즉 Briton-Lee의 제품으로 간주한다.[6][7] Teradata는 1990년 6월에 ShareBase로 이름이 바뀐 Briton Lee를 인수했다.[8] 다른 사람들은 가전제품을 Teradata의[9] "파괴 기술"로 간주하면서 동의하지 않는다.
Tandem Computers와 Sequent Computer Systems를 포함한 추가 벤더들도 1980년대에 MPP 아키텍처를 제공했다. 오픈 소스 및 상용 컴퓨팅 컴포넌트는 MPP 데이터 웨어하우스 어플라이언스의 재등장을 도왔다. 기술의 발전으로 스토리지 장치, 멀티 코어 CPU 및 네트워킹 구성 요소에서 비용이 절감되고 성능이 향상됨 Ingres 및 Postgre와 같은 오픈 소스 RDBMS 제품SQL, 소프트웨어 라이센스 비용을 절감하고 DW 애플리케이션 벤더가 기본 데이터베이스 기능 제공보다는 최적화에 집중할 수 있도록 허용. 오픈 소스 리눅스는 DW 어플라이언스의 공통 운영 체제가 되었다.
다른 DW 어플라이언스 공급업체는 MPP 아키텍처 대신 전문 하드웨어와 고급 소프트웨어를 사용한다.[10] Netezza는 2003년에 "데이터 어플라이언스"를 발표했고, 전문화된 현장 프로그램 가능한 게이트 어레이 하드웨어를 사용했다.[11] 킥파이어는 2008년에 이어 데이터 흐름을 "sql chip"[12][citation needed]이라고 불렀다.
2009년에는 더 많은 DW 어플라이언스가 등장했다. IBM은 InfoSphere Warehouse(이전의 DB2 Warehouse)를 자체 서버 및 스토리지와 통합하여 IBM InfoSphere Balance Warehouse를 만들었다. Netezza는 일반 IBM 하드웨어 기반의 TwinFin 플랫폼을 소개했다. 다른 DW 어플라이언스 공급업체도 주요 하드웨어 공급업체와 제휴했다. DATAllegro는 마이크로소프트가 인수하기 전에 EMC Corporation 및 Dell과 제휴하고 Linux에서 오픈 소스 Ingres를 구현했다. Greenplum은 Sun Microsystems와 파트너십을 맺고 Greenplum Database(Postgre 기반)를 구축한다.SQL) ZFS 파일 시스템을 사용하는 Solaris의 경우 HP Neoview는 HP NonStop SQL을 사용한다.
시장에서도 벤더가 하드웨어와 데이터베이스 소프트웨어를 데이터 웨어하우스 플랫폼으로 결합하는 데이터 웨어하우스 번들이 등장하고 있다. Oracle Optimized Warehouse Initiative는 Oracle 데이터베이스를 다양한 컴퓨터 제조업체(Dell, EMC, HP, IBM, SGI, Sun Micro시스템s)의 하드웨어와 결합한다. Oracle의 최적화된 웨어하우스는 사전 검증된 구성을 제공하며 데이터베이스 소프트웨어가 사전 설치됨 2008년 9월 Oracle은 Oracle이 판매하고 지원하는 공동 개발 및 공동 브랜드 플랫폼인 HP Oracle Database Machine과 Oracle 전용 구성으로 HP를 구축한 보다 클래식한 어플라이언스 제품을 제공하기 시작했다.[13][14] 2009년 9월 오라클은 인수한 Sun Microsystems 하드웨어를 기반으로 2세대 Exadata 시스템을 출시했다.[15]
참고 항목
- 비즈니스 인텔리전스(BI)
- 데이터 마이닝
- 데이터마트
- 데이터창고
참조
- ^ a b Infostor » '데이터 웨어하우스 어플라이언스' 소개
- ^ a b TDWI » 또 다른 데이터 웨어하우스 어플라이언스가 출시됨!
- ^ 지옥 블로그의 쿼리 » 어플라이언스가 어플라이언스가 아닌 경우
- ^ DBMS2 — DataBase Management System Services »Blog Archive » 데이터 웨어하우스 어플라이언스 – 사실과 허구
- ^ Omer Trajman, Alain Crolotte, David Steinhoff, Raghunath Nambiar, Meikel Poess: 데이터베이스는 Toasters가 아님: 데이터 웨어하우스 어플라이언스 비교를 위한 프레임워크
- ^ Kobielus, James (April 22, 2008). "Teradata Goes Appliance, Officially". Archived from the original on September 29, 2011. Retrieved 2011-01-14.
Teradata effectively established the DW appliance market a quarter-century ago when it rolled out the first in a long line of preconfigured, preoptimized solutions that combine CPUs, storage, software, and database to address the most demanding analytical and decision support requirements
- ^ "Database machines and data warehouse appliances – the early days". Monash Research. September 15, 2008. Retrieved 2011-01-15.
But for all practical purposes, the first two significant “database machine” vendors were Britton-Lee and Teradata. And since Britton-Lee eventually sold out to Teradata (after a brief name change to ShareBase), Teradata is entitled to whatever historical glory accrues from having innovated the database management appliance category.
- ^ All, Ann (Apr 6, 2007). "Will a Data Warehouse Appliance Work for You?". Retrieved 2011-01-14.
DATAllegro has a site at Sears. Sears uses [the appliance] as a front end to their Teradata warehouse to calculate aggregates. So when they want to do slice-and-dice, how many we sold in which stores and of what color, they use the appliance...I think [appliances] could be a disruptive technology for Teradata
- ^ [1]
- ^ "Netezza Performance Server (NPS™) 8000 Series". Product web page. Netezza. Archived from the original on February 3, 2004. Retrieved August 16, 2013.
- ^ "Archived copy". Archived from the original on 2009-05-24. Retrieved 2009-07-18.
{{cite web}}
: CS1 maint: 타이틀로 보관된 사본(링크) - ^ Oracle 성능 설계자 Kevin Clossen - Oracle Exadata Storage Server
- ^ "Oracle Exadata - What is the benefit?". Archived from the original on 2008-11-20. Retrieved 2008-11-19.
- ^ Alex Gorbachev (September 15, 2009). "Unveiling the OLTP Oracle Database Machine & Exadata v2". Blog. Pythian. Retrieved August 16, 2013.