Apache Hive

Apatxe Hive, infraestructura de data warehouse sobre Hadoop

Hive és un programari que treballa sobre clústers de Hadoop creant una capa que permet al desenvolupador abstreure's de la gestió de fitxers HDFS i MapReduce mitjançant operacions de consulta de dades basades en SQL, amb el llenguatge HiveQL.

Editor de consultas SQL de Apache Hive

Con Hive pueden realizarse consultas de no demasiada complejidad, no permite operaciones transaccionales, y al proporcionar un lenguaje similar al SQL de las bases de datos relacionales para trabajar con grandes cantidades de datos este software es muy adecuado para entornos de data warehouse y analítica. Por estas razones se define a Apache Hive como una infraestructura de data warehouse sobre Hadoop.

Hive fue inicialmente desarrollado por Facebook, aunque ha evolucionado como proyecto open source de Apache, dentro del ecosistema de Hadoop, y actualmente lo utilizan grandes compañías como Netflix o Amazon en Amazon Elastic MapReduce o AWS.

Apache Hive se instala como una herramienta más dentro de una instalación de Hadoop y obviamente necesita que los clústeres de Hadoop estén funcionando para poder trabajar sobre ellos.

Se pueden lanzar consultas a Hive tanto directamente desde un entorno de línea de comandos como desde aplicaciones a través de conectores de datos estándar como JDBC o ODBC. Hay que tener en cuenta que la capa de abstracción que proporciona Hive, aunque puede simplificar mucho el desarrollo de aplicaciones basadas en datos, no es tan eficiente como la utilización directa de MapReduce y gestión de ficheros HDFS, ya que el intérprete hace aumentar considerablemente la latencia de las aplicaciones.

Log in to post comments

Otros productos software del fabricante

Apache Hadoop

Arquitectura de apache Hadoop

La llibreria de programari de Hadoop és un framework que permet el processament distribuído de jocs de dades de gran volum utilitzant clústers d'ordinadors o servidors, utilitzat models de programació…

Prueba Semrush gratis 14 días!

Empresas especializadas

Software destacat

Semrush

Semrush és una eina web per a anàlisi SEO i SEM, orientada a la recerca de paraules clau (Keyword Research) i anàlisi de la competència.
Aquesta eina web, de pagament per ús, ofereix una interfície d'anàlisi fàcil d'utilitzar que dóna accés a dades de posicionament orgànic i de pagament per clic per a les 20 primeres paraules clau posicionades en els resultats de cerca (SERP) de les…