OLTP frente a OLAP



El siguiente blog habla brevemente sobre OLTP vs OLAP y los diversos casos de uso.

función dividida en el ejemplo de java

OLTP frente a OLAP

Se dice que OLTP es más un sistema transaccional en línea o un sistema de almacenamiento de datos, donde el usuario realiza muchas transacciones en línea utilizando el almacén de datos. También se dice que tiene más lecturas / escrituras ad-hoc en tiempo real.





OLAP es más un almacén de datos sin conexión. Se accedenumero de vecesde forma offline. Por ejemplo, los archivos de registro masivo se leen y luego se vuelven a escribir en archivos de datos. Algunas de las áreas comunes donde se usa OLAP son trabajos de registro, trabajos de minería de datos, etc.

Se dice que Cassandra es más OLTP, ya que es en tiempo real, mientras que Hadoop es más OLAP, ya que se usa para análisis y escrituras masivas.



¿Por qué integrar OLAP y OLTP?

Si en caso de que esté buscando el precio más barato para la reserva de hotel en los próximos 365 días, aquí tiene un enorme conjunto de datos para Cassandra y desea tener una recomendación en la base de datos en tiempo real, se ejecuta una promoción basada en el precio.

En tal escenario, tenemos que iterar todos los registros y mantener los análisis encima, que es un gran trabajo fuera de línea que debe iniciarse con frecuencia. Aquí, Hadoop entra en juego para el procesamiento de datos a granel.

es-una relación en java

El otro beneficio es que podemos ejecutar un clúster y cancelar la ejecución de un clúster de Hadoop diferente.



El tercer beneficio es que también se pueden reducir mucho los costes operativos.

Dado un escenario, en el que, si un usuario está bien versado en varios ecosistemas de Hadoop, como Hive, Pig Latin y necesita integrar datos en él, entonces uno debe conectar alguna fuente de datos en Cassandra e intentar ejecutar Map Reducir también los puestos de trabajo.

Hay un patrón notable entre OLTP y OLAP. En OLTP, hay menos cantidad de escrituras, p. Ej. Información del hotel. Suponiendo que los cambios de precio ocurren cada 5000 veces por segundo, las lecturas pueden ser más aquí. En tal escenario, puede haber 1 escritura por segundo, pero las lecturas podrían generar cientos y miles. Entonces, la proporción aquí es de alrededor de 1: 1000.

Es una observación interesante que Cassandra pueda encajar fácilmente en este modelo, que incluye modelos, donde lectura / escritura es igual. Además, cuando se trata de OLTP, incluso si uno entra en un modelo de consistencia fuerte y sintonizable, se puede ver una brecha de milisegundos entre los modelos consistentes eventuales y los modelos consistentes más fuertes. Por tanto, Cassandra puede encajar en OLTP.

Al llegar a OLAP, uno puede ver diferentes patrones OLAP, lo que significa que hay varias escrituras sucediendo simultáneamente. En OLAP, volcamos los datos de una sola vez, es decir, todos los archivos de registro se colocan en el almacén de datos y luego comenzamos a procesar. El patrón de datos o patrón de acceso es exactamente lo opuesto al tipo de aplicación OLTP. Aquí, Hadoop o MapReduce serán útiles.

cómo configurar la ruta de Java en Windows

Tienes una pregunta para nosotros? Menciónalos en la sección de comentarios y nos pondremos en contacto contigo.

Artículos Relacionados:

5 razones principales para aprender Cassandra