Big Data

Tutorial de HBase: Introducción a HBase y estudio de caso de Facebook

Este blog tutorial de HBase le presenta qué es HBase y sus características. También cubre el estudio de caso de Facebook Messenger para comprender los beneficios de HBase.

Instale Puppet: instale Puppet en cuatro sencillos pasos

Este blog es una guía sobre cómo instalar Puppet Master y Puppet Agent. También incluye un ejemplo para implementar Apache Tomcat usando el módulo Puppet Tomcat.

Instalación de Apache Pig en Linux

Este blog es una guía paso a paso para la instalación de Apache Pig en un entorno Linux. Instalaremos Apache Pig 0.16.0 y lo ejecutaremos en diferentes modos.

Arquitectura HBase: modelo de datos HBase y mecanismo de lectura / escritura HBase

Este blog sobre la arquitectura HBase explica el modelo de datos HBase y ofrece información sobre la arquitectura HBase. También explica diferentes mecanismos en HBase.

Tutorial de Hive - Arquitectura de Hive y estudio de caso de la NASA

Este blog de tutoriales de Hive le brinda un conocimiento profundo de la arquitectura de Hive y el modelo de datos de Hive. También explica el caso de estudio de la NASA sobre Apache Hive.

Tutorial de transmisión por secuencias de Spark: análisis de opiniones con Apache Spark

Este blog de Spark Streaming le presentará Spark Streaming, sus características y componentes. Incluye un proyecto de análisis de sentimiento mediante Twitter.

Spark MLlib: biblioteca de aprendizaje automático de Apache Spark

Este blog de Spark MLlib le presentará la biblioteca de aprendizaje automático de Apache Spark. Incluye un proyecto de sistema de recomendación de películas que utiliza Spark MLlib.

Tutorial de Spark GraphX: análisis de gráficos en Apache Spark

Este blog Tutorial de GraphX le presentará Apache Spark GraphX, sus características y componentes, incluido un proyecto de análisis de datos de vuelo.

Tutorial de Apache Flume: Transmisión de datos de Twitter

Este blog tutorial de Apache Flume explica los fundamentos de Apache Flume y sus características. También mostrará la transmisión de Twitter usando Apache Flume.

Tutorial de Apache Sqoop: importar / exportar datos entre HDFS y RDBMS

Tutorial de Apache Sqoop: Sqoop es una herramienta para transferir datos entre Hadoop y bases de datos relacionales. Este blog cubre la importación y exportación de Sooop desde MySQL.

Tutorial de Oozie: aprenda a programar sus trabajos de Hadoop

Tutorial de Apache Oozie: Oozie es un sistema de programación de flujo de trabajo para administrar trabajos de Hadoop. Es un sistema escalable, confiable y extensible.

Aplicaciones de Big Data en tiempo real en varios dominios

Las aplicaciones de Big Data están revolucionando las organizaciones y ayudándolas a tomar decisiones comerciales más informativas mediante el análisis de grandes volúmenes de datos.

Introducción a Spark con Python - PySpark para principiantes

Apache Spark se ha apoderado del mundo de Big Data & Analytics y Python es uno de los lenguajes de programación más accesibles que se utilizan en la industria en la actualidad. Entonces, aquí en este blog, aprenderemos sobre Pyspark (chispa con python) para obtener lo mejor de ambos mundos.

Tutorial de Hadoop YARN: aprenda los fundamentos de la arquitectura YARN

Este blog se centra en Apache Hadoop YARN, que se introdujo en la versión 2.0 de Hadoop para la gestión de recursos y la programación de trabajos. Explica la arquitectura YARN con sus componentes y las funciones que desempeña cada uno de ellos. Describe el envío de la aplicación y el flujo de trabajo en Apache Hadoop YARN.

Artículos Más Populares

Categoría

Artículos De Interés