¿Cómo ejecutar scripts de Hive?



Este es un tutorial sobre cómo ejecutar Hive Scripts. La ejecución de este script reducirá el tiempo y el esfuerzo que dedicamos a escribir y ejecutar cada comando manualmente.

Al ser un paquete de almacenamiento de datos construido sobre Hadoop, Apache Hive se utiliza cada vez más para el análisis de datos, la minería de datos y el modelado predictivo. Las organizaciones buscan profesionales con firmeza en . En esta publicación, veamos cómo ejecutar Hive Scripts. En general, usamos los scripts para ejecutar un conjunto de declaraciones a la vez. Los scripts de Hive se utilizan prácticamente de la misma manera. Reducirá el tiempo y el esfuerzo que dedicamos a escribir y ejecutar cada comando manualmente.

Los scripts de Hive son compatibles con Hive 0.10.0 y versiones posteriores. Como la versión de Hive 0.90 está instalada en CDH3, no podemos ejecutar Hive Scripts en CDH3. Puede probar los pasos a continuación en CDH4, ya que tiene instalada la versión Hive 0.10.0. ¿Sabe cómo crear un script de Hive? Si no, haga clic en para obtener más aclaraciones.





Master-Hive-Now

que es chef y marioneta

Ahora, veamos cómo escribir los scripts en Hive y ejecutarlos en CDH4:



Paso 1: escribir un script de Hive.

Para escribir el script de Hive, el archivo debe guardarse con la extensión .sql. Abra una terminal en su distribución Cloudera CDH4 y proporcione el siguiente comando para crear un script de Hive.
Mando: sudo gedit sample.sql

Al ejecutar el comando anterior, se abrirá el archivo con la lista de todos los comandos de Hive que deben ejecutarse.



En este script, se creará una tabla, se describirá y los datos se cargarán y recuperarán de la tabla.

1. Creación de la tabla en Hive:

Mando: crear producto de tabla (productid: int, productname: string, price: float, category: string) campos delimitados de formato de filas terminados por ','

Aquí, producto es el nombre de la tabla y {productid, productname, price, category} son las columnas de esta tabla.

Los campos terminados por ',' indican que las columnas del archivo de entrada están separadas por el símbolo ','.

De forma predeterminada, los registros del archivo de entrada están separados por una nueva línea.

2. Describiendo la tabla:

Mando: describir producto

3. Carga de datos en la tabla.

Para cargar los datos en la tabla, primero necesitamos crear un archivo de entrada que contenga los registros que deben insertarse en la tabla.

Creemos un archivo de entrada.

Mando: sudo gedit input.txt

Edite el contenido del archivo como se muestra en la figura.

4. Recuperar los datos:

Para recuperar los datos, se utiliza el comando de selección.

Mando: Seleccionar * del producto

El comando anterior se utiliza para recuperar el valor de todas las columnas presentes en la tabla. El script debe ser como se muestra en la imagen de abajo.

Ahora, hemos terminado de escribir el guión de Hive. Ahora se puede guardar el archivo sample.sql.

Paso 2: ejecutar el script de Hive

El siguiente es el comando para ejecutar el script de Hive:

cómo crear una matriz dinámica en java

Mando: colmena –f /home/cloudera/sample.sql

Mientras ejecuta el script, asegúrese de que esté presente toda la ruta de la ubicación del archivo de script.

Podemos ver que todos los comandos se ejecutan con éxito.

Así es como se ejecutan y ejecutan los scripts de Hive en CDH4.

Hive es un componente fundamental de Hadoop y su experiencia en Hive puede conseguirle trabajos de Hadoop mejor pagados. Edureka tiene un curso de Hadoop especialmente seleccionado que le ayuda a dominar conceptos como MapReduce, Yarn, Pig, Hive, HBase, Oozie, Flume y Sqoop. Haga clic en el botón de abajo para comenzar.

lanzando un doble a un int java

Tienes una pregunta para nosotros? Por favor, menciónelos en la sección de comentarios y nos comunicaremos con usted.

Artículos Relacionados:

Comandos de Hive

Modelos de datos de Hive