¿Por qué debería combinar cuando ya puede unirse a Tableau?



Combinación de datos en Tableau: un método que se utiliza cuando hay datos relacionados en varias fuentes de datos, que desea analizar juntos en una sola vista.

En un mundo que genera y consume 2,5 trillones de bytes de datos al día, las organizaciones están obligadas a buscar nuevos métodos para transformar y combinar datos a fin de lograr una eficiencia óptima. Uno de esos métodos de combinar datos es Combinación de datos en Tableau .

secuencia de fibonacci c ++

Ahora, debido a que esto cumple un propósito tan importante en el ciclo de datos de cualquier organización, lo convierte en un módulo muy esencial en la mayoría de . En este blog, discutiremos los siguientes conceptos:





¿Por qué necesita la combinación de datos en Tableau?

Supongamos que eres un Mesa de desarrolladores que tiene datos transaccionales almacenados en Salesforce y datos de cuotas almacenados en Access. Los datos que desea combinar se almacenan en diferentes bases de datos, y la granularidad de los datos capturados en cada tabla es diferente en las dos fuentes de datos, por lo que la combinación de datos es la mejor manera de combinar estos datos.

La combinación de datos es útil en las siguientes condiciones:



  1. Desea combinar datos de diferentes bases de datos que no son compatibles con las uniones entre bases de datos.

    Las uniones entre bases de datos no admiten conexiones a cubos (por ejemplo, Oracle Essbase) ni a algunas conexiones de solo extracción (por ejemplo, Google Analytics). En este caso, configure fuentes de datos individuales para los datos que desea analizar y luego use la combinación de datos para combinar las fuentes de datos en una sola hoja.

  2. Los datos se encuentran en diferentes niveles de detalle.

    A veces, un conjunto de datos captura datos utilizando varios niveles de detalle es decir, mayor o menor granularidad que el otro conjunto de datos.

    Por ejemplo, suponga que está analizando datos de transacciones y datos de cuotas. Los datos transaccionales pueden capturar todas las transacciones. Sin embargo, los datos de cuotas pueden agregar transacciones a nivel de trimestre. Debido a que los valores transaccionales se capturan en diferentes niveles de detalle en cada conjunto de datos, debe usar la combinación de datos para combinar los datos.



¿Qué es la combinación de datos en Tableau?

La combinación de datos es una función muy poderosa en Tablero . Se utiliza cuando hay datos relacionados en varias fuentes de datos, que desea analizar juntos en una sola vista. Es un método para combinar datos que complementa una tabla de datos de una fuente de datos con columnas de datos de otra fuente de datos.

Por lo general, utiliza combinaciones para realizar este tipo de combinación de datos, pero hay ocasiones, según factores como el tipo de datos y su granularidad, en las que es mejor usar la combinación de datos.

cómo configurar classpath en java en Windows 10

¿En qué se diferencia de la unión de datos?

La combinación de datos simula una combinación izquierda tradicional. La principal diferencia entre los dos es cuando la unión se realiza con respecto a la agregación.

Unión izquierda

Cuando usa una combinación izquierda para combinar datos, se envía una consulta a la base de datos donde se realiza la combinación. El uso de una combinación izquierda devuelve todas las filas de la tabla izquierda y cualquier fila de la tabla derecha que tenga una coincidencia de fila correspondiente en la tabla izquierda. Luego, los resultados de la unión se envían de vuelta a Tableau y los agrega.

Por ejemplo, suponga que tiene las siguientes tablas. Si las columnas comunes son ID de usuario , una combinación a la izquierda toma todos los datos de la tabla de la izquierda, así como todos los datos de la tabla de la derecha porque cada fila tiene una coincidencia de fila correspondiente en la tabla de la izquierda.

Unión de datos - Combinación de datos en Tableau - EdurekaCombinación de datos

Cuando usa la combinación de datos para combinar datos, se envía una consulta a la base de datos para cada fuente de datos que se usa en la hoja. Tableau envía y combina los resultados de las consultas, incluidos los datos agregados. La vista utiliza todas las filas de la fuente de datos principal, la tabla de la izquierda y las filas agregadas de la fuente de datos secundaria, la tabla de la derecha, según la dimensión de los campos de enlace.

Puede cambiar el campo de enlace o agregar más campos de enlace para incluir filas de datos diferentes o adicionales de la fuente de datos secundaria en la combinación, cambiando los valores agregados.

Por ejemplo, suponga que tiene las siguientes tablas. Si los campos de enlace son ID de usuario en ambas tablas, la combinación de sus datos toma todos los datos de la tabla de la izquierda y complementa la tabla de la izquierda con los datos de la tabla de la derecha. En este caso, no todos los valores pueden ser parte de la tabla resultante debido a lo siguiente:

  • Una fila en la tabla de la izquierda no tiene una coincidencia de fila correspondiente en la tabla de la derecha, como lo indica el valor nulo.
  • Hay varios valores correspondientes en las filas de la tabla de la derecha, como se indica con el asterisco (*).

Suponga que tiene las mismas tablas que las anteriores, pero la fuente de datos secundaria contiene un nuevo campo llamado Fines . Nuevamente, si el campo de enlace es ID de usuario , la combinación de sus datos toma todos los datos de la tabla de la izquierda y los complementa con los datos de la tabla de la derecha. En este caso, verá el mismo valor nulo y asteriscos en el ejemplo anterior además de lo siguiente:

  • Porque el Fines campo es una medida, verá los valores de fila para elFinescampo agregado antes de que los datos de la tabla de la derecha se combinen con los datos de la tabla de la izquierda.
  • Como en el ejemplo anterior, una fila en la tabla de la izquierda no tiene la fila correspondiente para el Fines campo, como lo indica el segundo valor nulo.

Cuándo sustituir la incorporación por Mezcla

1. Los datos necesitan limpieza.

Si sus tablas no coinciden correctamente entre sí después de una combinación, configure las fuentes de datos para cada tabla, realice las personalizaciones necesarias (es decir, cambie el nombre de las columnas, cambie los tipos de datos de las columnas, cree grupos, use cálculos, etc.) y luego use la combinación de datos para combinar los datos.

2. Las uniones provocan datos duplicados.

Los datos duplicados después de una combinación son un síntoma de datos en diferentes niveles de detalle. Si observa datos duplicados, en lugar de crear una combinación, utilice la combinación de datos para combinar en una dimensión común.

3. Tiene muchos datos.

Normalmente, se recomiendan las uniones para combinar datos de la misma base de datos. Las uniones son manejadas por la base de datos, lo que permite que las uniones aprovechen algunas de las capacidades nativas de la base de datos. Sin embargo, si está trabajando con grandes conjuntos de datos, las uniones pueden ejercer presión sobre la base de datos y afectar significativamente el rendimiento. En este caso, la combinación de datos podría ayudar. Debido a que Tableau maneja la combinación de datos después de que se agregan, hay menos datos para combinar. Cuando hay menos datos para combinar, generalmente, el rendimiento mejora.

Combinar sus datos en Tableau

Puede utilizar la combinación de datos cuando tenga datos en fuentes de datos independientes que desee analizar juntos en una sola hoja. Tableau tiene dos fuentes de datos incorporadas llamadas Supertienda de muestras y Muestra de café chain.mdb que se utilizará para ilustrar la combinación de datos.

Paso 1: conéctese a sus datos y configure las fuentes de datos

  • Conéctese a un conjunto de datos y configure la fuente de datos en la página de la fuente de datos. Y yofuente de datos incorporada Muestra de café chain.mdb ,que es un archivo de base de datos de MS Access, se utilizará para ilustrar la combinación de datos.
  • Ir Datos > Nueva fuente de datos, conéctese al segundo conjunto de datos.Este ejemplo usa el Muestra - Superstore fuente de datos. TA continuación, configure la fuente de datos.
  • Haga clic en la pestaña de la hoja para comenzar a construir su vista.

Paso 2: designe una fuente de datos primaria

  • Arrastre al menos un campo de su fuente de datos principal a la vista para designarlo como la fuente de datos principal. En el Datos panel, haga clic en la fuente de datos que desea designar como fuente de datos principal. En este ejemplo, Muestra de cadena de café está seleccionado.
  • La siguiente captura de pantalla muestra las diferentes tablas y combinaciones disponibles en el archivo.

código de la serie de fibonacci en java

Paso 3: designe una fuente de datos secundaria

  • Los campos que se utilizan en la vista de fuentes de datos que no son la fuente de datos principal o los enlaces activos designan automáticamente las fuentes de datos posteriores como la fuente de datos secundaria. En este caso, Sample Superstore.

Paso 4: combinar datos

  • Ahora puede integrar los datos de ambas fuentes en función de una dimensión común ( Estado , en este caso). Tenga en cuenta que aparece una pequeña imagen de enlace junto a la dimensión - Estado. Esto indica la dimensión común entre las dos fuentes de datos.
  • Suponga que crea un gráfico de barras con Relación de ganancia en el estante de columnas y Estado En el estante de filas, el gráfico muestra cómo varía la proporción de ganancias para cada estado, tanto en la supertienda como en las cadenas de cafeterías.

Limitaciones de la combinación de datos en Tableau

  1. Existen algunas limitaciones de combinación de datos en torno a los agregados no aditivos, como MEDIANA y RAWSQLAGG .
  2. La combinación de datos compromete la velocidad de la consulta en alta granularidad.
  3. Cuando intenta ordenar por un campo calculado que usa datos combinados, el campo calculado no aparece en la lista desplegable Campo del cuadro de diálogo Ordenar.
  4. Las fuentes de datos de cubo solo se pueden utilizar como fuente de datos principal para combinar datos en Tableau. No se pueden utilizar como fuentes de datos secundarias.

Espero que todos, ahora, tengan una idea clara sobre Combinación de datos en Tableau de este blog. ¿Tienes hambre de más conocimientos? No se preocupe, este video le permitirá comprender mejor el concepto.