아파치 임팔라

Apache Impala
아파치 임팔라
Apache Impala Logo
개발자Apache 소프트웨어 재단
초기 릴리즈2013년 4월 28일, 9년 전(2013-04-28)
안정된 릴리스
4.0.0 / 2021년 7월 12일, 13개월 전(2021-07-12)[1]
저장소Impala 저장소
기입처C++, Java
운영 체제크로스 플랫폼
유형관계형 하둡 분석
면허증.Apache 라이센스 2.0
웹 사이트impala.apache.org

Apache Impala는 Apache [2]Hadoop을 실행하는 컴퓨터 클러스터에 저장된 데이터를 위한 MPP(Open Source Massively Parallel Processing) SQL 쿼리 엔진입니다.Impala는 2012년 [3]개발에 영감을 준 Google F1과 동등한 오픈 소스로 묘사되어 왔다.

묘사

Apache Impala는 Apache Hadoop에서 실행되는 쿼리 엔진입니다.이 프로젝트는 2012년 10월에 공개 베타 테스트[4][5] 배포와 함께 발표되었으며 2013년 [6]5월에 일반에 공개되었습니다.

Impala는 확장 가능한 병렬 데이터베이스 기술을 Hadoop에 제공하므로 사용자는 데이터 이동이나 변환 없이 HDFS 및 Apache HBase에 저장된 데이터에 대해 짧은 지연 시간 SQL 쿼리를 실행할 수 있습니다.Impala는 Hadoop과 통합되어 MapReduce, Apache Hive, Apache Pig 및 기타 Hadoop 소프트웨어에서 사용하는 것과 동일한 파일 및 데이터 형식, 메타데이터, 보안 및 리소스 관리 프레임워크를 사용합니다.

Impala는 분석가 및 데이터 과학자를 위해 SQL 또는 비즈니스 인텔리전스 툴을 통해 Hadoop에 저장된 데이터를 분석하도록 홍보되었습니다.그 결과, MapReduce를 통해 대규모 데이터 처리와 인터랙티브 쿼리를 동일한 시스템에서 동일한 데이터 및 메타데이터를 사용하여 수행할 수 있습니다.따라서 분석을 수행하기 위해 데이터 세트를 전용 시스템 및/또는 자체 형식으로 이행할 필요가 없습니다.

특징은 다음과 같습니다.

2013년 초, [7]Impala를 포함한 아키텍처에 대해 Parquet이라는 컬럼 지향 파일 형식이 발표되었습니다.2013년 12월 Amazon Web Services는 Impala [8]지원을 발표했습니다.2014년 초에 MapR은 Impala에 [9]대한 지원을 추가했습니다.2015년에는 Kudu라는 또 다른 포맷이 발표되었는데, Cloudera는 Impala와 [10]함께 Apache Software Foundation에 기부할 것을 제안했다.Impala는 [11]2017년 11월 28일에 Apache Top-Level Project(TLP)를 졸업했습니다.

「 」를 참조해 주세요.

  • Apache Drill - Dremel에서 영감을 얻은 유사한 오픈 소스 프로젝트
  • Dremel - 구글의 유사한 도구
  • Trino - Presto 작성자가 작성한 오픈 소스 SQL 쿼리 엔진
  • Presto - Facebook에서 만들고 Teradata에서 지원하는 오픈 소스 SQL 쿼리 엔진

레퍼런스

  1. ^ @ApacheImpala (July 13, 2021). "The Apache Impala team is pleased to announce the release of Impala 4.0.0" (Tweet) – via Twitter.
  2. ^ "Apache Impala". Retrieved 15 September 2017.
  3. ^ Cade Metz (October 24, 2012). "Man Busts Out of Google, Rebuilds Top-Secret Query Machine". Wired Magazine. Retrieved October 10, 2016.
  4. ^ Larry Digna (October 24, 2012). "Cloudera aims to bring real-time queries to Hadoop, big data". Between the lines blog. ZDNet. Retrieved January 20, 2014.
  5. ^ Andrew Brust (October 25, 2012). "Cloudera's Impala brings Hadoop to SQL and BI". ZDNet. Retrieved January 20, 2014.
  6. ^ Marcel Kornacker, Justin Erickson (May 1, 2013). "Cloudera Impala 1.0: It's Here, It's Real, It's Already the Standard for SQL on Hadoop". Archived from the original on April 13, 2014. Retrieved April 10, 2014.
  7. ^ "Parquet: Columnar Storage for Hadoop". Project web site. 2013. Retrieved January 20, 2014.
  8. ^ "Announcing Support for Impala with Amazon Elastic MapReduce". Amazon.com. December 12, 2013. Retrieved January 20, 2014.
  9. ^ "Impala for MapR". MapR.com. February 2, 2014. Retrieved April 10, 2014.
  10. ^ David Ramel (November 18, 2015). "Cloudera to Donate Impala and Kudu Big Data Projects to Apache". Application Development Trends. Retrieved October 10, 2016.
  11. ^ "The Apache Software Foundation Announces Apache Impala as a Top-Level Project". November 28, 2017. Retrieved November 30, 2017.

외부 링크

  • Apache Impala 프로젝트 웹사이트
  • Impala GitHub 프로젝트 소스 코드