Oracle a HDFS usando Sqoop



Oracle a HDFS usando Sqoop: consulte los pasos para Oracle a HDFS usando Sqoop.

1. Descargue Oracle Expresss Edition desde el siguiente enlace y descomprímalo.





https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40NNW5BcHZMTkdtcmc/edit

61



2. Después de extraer, encontrará un archivo ejecutable de Oracle XE Edition como en la siguiente imagen.

3. Haga doble clic en OracleXEUniv para instalar la base de datos Oracle en su sistema y haga clic en Ejecutar.



4. Haga clic en Siguiente

5. Acepte el contrato de licencia y haga clic en siguiente.

6. De forma predeterminada, Oracle tomará el sistema como nombre de la base de datos. Ingresemos contraseña

para esta base de datos.

Ingrese contraseña -> sistema

Confirmar contraseña -> sistema

Haga clic en Siguiente:

7. Haga clic en Instalar

8. Haga clic en Finalizar.

9. Editemos el archivo sqlnet.ora presente en la carpeta

C: oraclexepporacleproduct.2.0serverNETWORKADMIN

Cuando lo abra, encontrará el contenido a continuación.

Edítelo como en la siguiente captura de pantalla

10. Iniciemos la línea de comandos SQL de Oracle.

Vaya al menú Inicio -> Todos los programas -> Oracle Database 10g Express Edition ->

Ejecute la línea de comandos SQL y haga doble clic en él.

11. Obtendrá la base de datos Cli para Oracle.

12. Conectémonos a la base de datos de Oracle.

Nombre de usuario: sistema

establecer la ruta de clase para java

Contraseña: sistema

Recibirá el mensaje conectado correctamente.

13. Creemos una tabla simple.

Mando:

crear tabla emp (número de identificación)

14. Insertemos algunos valores en él usando el comando Insertar.

Mando:

insertar en valores emp (2)

15.Comprobemos si los datos están insertados en la tabla usando el comando Seleccionar.

Mando:

seleccionar * de emp

16. Confirmemos los datos.

Mando:

cometer

17. Para importar los datos de Oracle Database a Sqoop, debemos agregar el

Conector de Oracle (ojdbc6_g.jar).

Puede descargar el frasco desde el siguiente enlace.

https://docs.google.com/a/edureka.in/file/d/0B2-rlCGKD40Nekw3ZXBRWUU5Y1E/edit

18.Abra Cloudera cdh3 y mueva el conector de Oracle a Cloudera cdh3 (al escritorio) usando FileZilla.

Utilice el siguiente enlace para comprender cómo mover un archivo de Windows a cloudera cdh3 vm.

https://www.edureka.co/blog/transfer-files-windows-cloudera-demo-vm/

19. Una vez que el conector Oracle esté presente en Cloudera Cdh3 Desktop, muévalo a la carpeta lib de

sqoop ejecutando el siguiente comando:

Mando:

sudo cp /home/cloudera/Desktop/ojdbc6_g.jar / usr / lib / sqoop / lib /

20. Cambie el directorio a Sqoop ejecutando el siguiente comando:

Mando:

cd / usr / lib / sqoop /

21. Abra el símbolo del sistema (CMD) en Windows y verifique Dirección IPv4

ejecutando el

debajo del comando:

Mando:

ipconfig

22. Importe los datos de la tabla emp presente en la base de datos Oracle a hdfs ejecutando lo siguiente

mando:

Elementos necesarios para el comando:

Dirección IPv4: su dirección IPv4. En mi caso es 192.168.46.1

Nombre de la base de datos: sistema

Nombre de la tabla: emp

Nombre de usuario - sistema

Contraseña - sistema

Directorio de salida: podría ser cualquiera. He usado sqoopoutput1

Mando:

sudo bin / sqoop import –connect jdbc: oracle: thin: system /

system@192.168.46.1: 1521: vehículo

–Nombre de usuario system -P –table system.emp –columns “ID” –target-dir /

sqoopoutput1 -m 1

23. Cuando el comando se haya ejecutado correctamente, recibirá el mensaje

que recuperaron los registros como en la imagen de abajo.

24. Abra el navegador y vaya a la siguiente URL:

URL: http: // localhost: 50070 / dfshealth.jsp

Haga clic en Examinar el sistema de archivos

25. Haga clic en el directorio sqoopoutput1

26. Haga clic en el archivo part-m-00000:

27 A continuación se muestran los datos que se importaron desde la base de datos Oracle:

¡Felicidades! Ha importado correctamente datos de la base de datos Oracle

a HDFS usando Sqoop ..!