Apache Drill è un framework open source che supporta applicazioni distribuite per analisi interattive su grandi insiemi di dati. Drill è la versione open source di Google Dremel disponibile come servizio infrastrutturale chiamato Google BigQuery. Un obiettivo dichiarato è che Drill sia capace di scalare fino a 10.000 server o più e di elaborare petabyte di dati e trilioni di record al secondo. Drill è un progetto di primo livello di Apache.

Caratteristiche

  • Modello a documento JSON senza schema simile a MongoDB e Elasticsearch
  • API standard: ANSI SQL, ODBC/JDBC, API RESTful
  • Facile da usare per l'utente e lo sviluppatore
  • Architettura che permette la connettività a più fonti dato
  • Supporto a Hadoop (HDFS API 2.3 ), MongoDB, Amazon EMR,MapR, CDH, HBase
  • Supporto alle piattaforme cloud: Amazon S3, Google Cloud Storage, Azure Blob Storage, Swift

Note

Collegamenti esterni

  • (EN) Sito ufficiale, su drill.apache.org.
  • Repository sorgenti di Apache Drill, su github.com.
  • Repository sorgenti di Apache Drill, su git.apache.org.
  • Sito di segnalazione bug, su issues.apache.org.

MapR delivers Apache Drill 1.0 DCD

Introduction to Apache Drill PPT

Apache Drill Support BPMConseil

An introduction to Apache Drill

Images of Apache Drill JapaneseClass.jp