hive.ppt

6
HIVE ©

Transcript of hive.ppt

Page 1: hive.ppt

HIVE

©

Page 2: hive.ppt

¿Qué es?

Hive es almacén de datos creado específicamente para Hadoop que nos facilita la tarea de sumarizar los datos pre-existentes en HDFS. La idea principal de Hive es la de funcionar como capa externa a Hadoop a modo de envoltorio, donde vamos a poder realizar consultas sobre el sistema de archivos que serán tratadas como MapReduces en modo nativo en HDFS.

Page 3: hive.ppt

Para poder realizar estas operaciones, los de Apache crearon un lenguaje de consultas a "base de datos" (recordemos que HDFS es un sistema de ficheros) muy similar a SQL, que denominaron HiveQL o HQL (dependiendo de en que libro lo leas lo verás de una manera u otra).

¿Qué es?

Page 4: hive.ppt

El corazón de esta idea se basa en el denominado MetaStore, que es un "lugar" donde se van a ir guardando toda la información relacionada con las operaciones en Hive,

Características Principales

Page 5: hive.ppt

Una sintaxis concisa, elegante y flexibles

Programas Scala tienden a ser cortosUna estimación más conservadora sería que un programa típico Scala debería tener aproximadamente la mitad del número de líneas del mismo programa escrito en Java. Menos líneas de código significan no sólo escribir menos, sino también menos esfuerzo en lectura y comprensión de los programas.La inferencia de tipos minimiza la necesidad de información de tipo explícito en muchos contextos. Las declaraciones de tipos y funciones son muy concisas.

Características Principales

Page 6: hive.ppt

Contacto

www.saxsa.com.mx

[email protected]

@BigData_WG

/bigdatamx