Las transformaciones de Informatica son objetos de repositorio que pueden leer, modificar o pasar datos a las estructuras de destino definidas, como tablas, archivos o cualquier otro destino necesario. Una transformación se utiliza básicamente para representar un conjunto de reglas, que definen el flujo de datos y cómo se cargan los datos en los destinos. Informatica PowerCenter proporciona múltiples transformaciones, cada una de las cuales tiene una funcionalidad particular.Además, dado que Informatica lidera el mercado actual en la plataforma de integración de datos, Informatica Transformations se presenta como un concepto crucial requerido para .
Para comprender mejor las transformaciones de Informatica, primero comprendamos qué es el mapeo. Un mapeo es una colección de objetos de origen y destino vinculados entre sí por un conjunto de transformaciones. Por lo tanto, las transformaciones en un mapeo representan las operaciones que el servicio de integración realizará en los datos durante la ejecución del flujo de trabajo. Para comprender mejor el flujo de trabajo, puede consultar nuestro blog Tutorial de Informatica: gestión del flujo de trabajo
¿Cuáles son las diversas transformaciones de Informatica?
Las transformaciones de Informatica se pueden clasificar principalmente en dos categorías. En primer lugar, se basa en la conectividad (vinculación en el mapeo) de las transformaciones entre sí y el segundo se basa en el cambio en el número total de filas entre el origen y el destino. Comencemos por echar un vistazo a las transformaciones de Informatica basadas en la conectividad.
1) Tipos de transformaciones en Informatica basadas en la conectividad:
- Transformaciones conectadas.
- Transformaciones desconectadas.
En Informatica, las transformaciones que están conectadas a una o más transformaciones se denominan Transformaciones conectadas .
Las transformaciones conectadas se utilizan cuando para cada fila de entrada, se llama a una transformación y se espera que devuelva un valor. Por ejemplo, podemos usar una transformación de búsqueda conectada para conocer los nombres de cada empleado que trabaja en un departamento específico especificando el ID de departamento en la expresión de búsqueda.
Algunas de las principales transformaciones de Informatica conectadas son Aggregator, Router, Joiner, Normalizer, etc.
Aquellas transformaciones que no están conectadas a ninguna otra transformación se denominan Transformaciones desconectadas .Su funcionalidad se usa llamándolos dentro de otras transformaciones como Transformación de expresión. Estas transformaciones no forman parte del proceso de mapeo.
Las transformaciones no conectadas se utilizan cuando su funcionalidad solo se requiere en base a ciertas condiciones.Por ejemplo, como programador, desea realizar una operación complicada con los datos, sin embargono desea utilizar transformaciones de Informatica como transformaciones de expresión o filtro para realizar esta operación. En tal caso, puede crear una biblioteca compartida de UNIX o DLL externa con los códigos para realizar la operación y llamarlos en la transformación del procedimiento externo.
Hay 3 transformaciones de Informatica a saber. Procedimiento externo, búsqueda y procedimiento almacenado que pueden desconectarse en una asignación válida (una asignación que puede ejecutar el servicio de integración).
2) Tipos de transformaciones de Informatica según el cambio en el número de filas
- Transformaciones activas
- Transformaciones pasivas
Transformaciones activas :- Una transformación activa puede realizar cualquiera de las siguientes acciones:
- Cambiar el número de filas que pasa por la transformación: por ejemplo, la transformación de filtro está activa porque elimina las filas que no cumplen la condición de filtro.
- Cambiar el límite de la transacción: un límite de la transacción es un límite que encierra todas las transacciones antes de que se llame a una confirmación o entre dos llamadas de confirmación. Por ejemplo, durante una operación transaccional, el usuario siente que después de ciertas transacciones se requiere una confirmación y llama al comando de confirmación para crear un punto de guardado y, al hacerlo, el usuario cambia el límite de transacción predeterminado. De forma predeterminada, el límite de la transacción se encuentra entre el inicio del archivo y el punto de confirmación automática o EOF.
- Cambiar el atributo rowtype: el atributo Rowtype es un tipo de registro que representa una fila en una tabla. El registro puede almacenar una fila completa de datos seleccionados de la tabla o recuperarlos de un puntero o variable de puntero. Por ejemplo, la transformación de la estrategia de actualización marca el tipo de fila como 0 para insertar valores, 1 para actualizar, 2 para eliminar o 3 para rechazar.
- Agregador, Filtro, Unión, Normalizador, etc. son algunos ejemplos de transformación activa.
Transformación pasiva : Una transformación pasiva es aquella que satisfará todas estas condiciones:
- El número de filas antes y después de la transformación es el mismo.
- Mantiene el límite de la transacción.
- Mantiene el atributo rowtype.
- Expression, ExternalProcedure, HTTP, etc. son algunos ejemplos de transformación pasiva.
En la transformación pasiva, no se crean nuevas filas o se eliminan las existentes.
Debe preguntarse por qué se utilizan las transformaciones pasivas si no cambian el número de filas. Generalmente se utilizan para actualizar valores, llamar a un procedimiento externo desde una biblioteca compartida y definir la entrada y salida de maplets. Un maplet es una colección de solo las transformaciones del mapeo. Por ejemplo, para una base de datos de estudiantes, deseamos actualizar los valores de la columna de calificaciones al percentil en lugar del porcentaje, esto se puede hacer usando una transformación de expresión que convertirá los valores y los actualizará en las mismas columnas manteniendo el mismo número total de filas. después de las transformaciones.
No hay ninguna restricción de que si una transformación se usa como una transformación pasiva, no se puede usar más adelante como una transformación activa. Del mismo modo, una transformación no conectada se puede utilizar como una transformación conectada según las necesidades. Se pueden formar todas las combinaciones posibles entre estas categorías y esta es la magia de las transformaciones de Informatica. Obtendrá una mejor idea más adelante en este blog sobre los posibles tipos a los que puede pertenecer una transformación.
Ahora que hemos comprendido los distintos tipos de transformaciones de Informatica, comencemos a explorarlos.A continuación, se muestran algunos tipos principales de transformaciones de Informatica:
Transformación | Tipo | Descripción |
Agregador | Activo Conectado | Realiza cálculos agregados. |
Expresión | Conectado pasivo | Calcula un valor. |
Java | Conectado activo o conectado pasivo | Ejecuta lógica de usuario codificada en Java. El código de bytes para la lógica del usuario se almacena en el repositorio |
Carpintero | Activo Conectado | Une datos de diferentes bases de datos o sistemas de archivos planos. |
Buscar | Activo conectado o pasivo conectado o activo desconectado o pasivo desconectado | Busque y devuelva datos de un archivo plano, una tabla relacional, una vista o un sinónimo. |
Normalizador | Activo Conectado | Se utiliza en la canalización para normalizar datos de fuentes de archivos sin formato o relacionales. |
Rango | Activo Conectado | Limita los registros a un rango superior o inferior. |
Enrutador | Activo Conectado | Enruta los datos en múltiples transformaciones según las condiciones del grupo. |
SQL | Conectado activo o conectado pasivo | Ejecuta consultas SQL en una base de datos. |
Unión | Activo Conectado | Fusiona datos de diferentes bases de datos o sistemas de archivos planos. |
Generador XML | Activo Conectado | Lee datos de uno o más puertos de entrada y genera XML a través de un solo puerto de salida. |
Analizador XML | Activo Conectado | Lee XML desde un puerto de entrada y envía datos a uno o más puertos de salida. |
Calificador de origen XML | Activo Conectado | Representa las filas que el servicio de integración lee de una fuente XML cuando ejecuta una sesión. |
Comencemos ahora a ver las transformaciones una por una.
Transformación de agregador
La transformación de agregador es una transformación activa y conectada. Esta transformación de Informatica es útil para realizar cálculos como promedios y sumas (principalmente para realizar cálculos en varias filas o grupos). Por ejemplo, para calcular el número total de ventas diarias o para calcular el promedio de ventas mensuales o anuales. Las funciones de agregación como AVG, FIRST, COUNT, PERCENTILE, MAX, SUM, etc., se pueden utilizar en la transformación agregada.
Transformación de búsqueda
La transformación de búsqueda es la transformación de Informatica más popular y utilizada. Según el requisito que tenga el usuario, la transformación de búsqueda se puede utilizar como una transformación conectada o desconectada combinándola como una transformación activa o pasiva. yoSe utiliza para buscar principalmente los detalles de una fuente, calificador de fuente o destino con el fin de obtener los datos requeridos relevantes. También puede buscar un 'archivo plano', una 'tabla relacional', una 'vista' o un 'sinónimo'. Se pueden usar múltiples transformaciones de búsqueda en un mapeo.
La transformación de búsqueda se crea con el siguiente tipo de puertos (Puntos lógicos para transferencia de información):
- Puerto de entrada (I)
- Puerto de salida (O)
- Buscar puertos (L)
- Puerto de retorno (R) (solo en caso de búsqueda no conectada)
Diferencias entre la transformación de búsqueda conectada y no conectada:
ventajas de la sobrecarga de métodos en java
- La búsqueda conectada recibe valores de entrada directamente de la canalización de mapeo, mientras que la búsqueda no conectada recibe valores de la búsqueda expresión de otra transformación. Un mapeo en Informatica puede contener Origen, Transformaciones y Destinos conectados entre sí y se consideran una canalización.
- La búsqueda conectada devuelve múltiples columnas de la misma fila ya que tienen múltiples puertos de retorno, dondesLa búsqueda no conectada tiene solo un puerto de retorno y devuelve una columna de cada fila. Por ejemplo, si usamos una búsqueda conectada en una base de datos de empleados para una identificación de departamento específica como parámetro, podemos obtener todos los detalles relacionados con los empleados de ese departamento, como sus nombres, número de identificación de empleado, dirección, etc., mientras que con Una búsqueda no conectada, podemos obtener solo un atributo del empleado, como su nombre o número de identificación de empleado, o cualquier atributo especificado por el usuario.
- La búsqueda conectada almacena en caché todas las columnas de búsqueda, mientras que la búsqueda no conectada almacena en caché solo el resultado de la búsqueda y las condiciones de búsqueda.
- La búsqueda conectada admite valores predeterminados definidos por el usuario, mientras que la búsqueda no conectada no admite valores definidos por el usuario. Por ejemplo, si desea cambiar todos los valores de una determinada columna a NULL después de la búsqueda, puede establecer el valor predeterminado de esas columnas en NULL en las expresiones de búsqueda. Sin embargo, esta función no es posible en caso de búsqueda no conectada.
Digamos de una base de datos de clientes, deseo conocer los detalles de los clientes que tienen más de una factura no cancelada. Para obtener estos datos, podemos utilizar una transformación de búsqueda.
Estos son los pasos.
- Comience cargando la tabla Factura como origen en el diseñador de mapas. En caso de que no tenga claro cómo cargar datos de origen en Designer, haga clic aquí .
- Ahora filtremos las facturas que no se cancelan. Para hacer esto, cree un nuevo filtro llamado fil_ODS_CUSTOMER_ACTIVE al calificador de origen con la propiedad NOT (ISNULL (DATE_CLOSED)) Y CANCELADO = 0.
- Ahora agregue una transformación de búsqueda en el diseñador como se ve a continuación con el nombre como lkp_CUSTOMER :
- Especifique la tabla de búsqueda como tabla de clientes.
- Haga doble clic en el encabezado de lkp_CUSTOMER para abrir el menú de edición. En la pestaña Condición, establezca la condición de búsqueda como CUST_ID = CUST_NO.
- En la pestaña Propiedades, cambie la Información de conexión a $ Fuente y haga clic en Okay para salvar la transformación:
- Vincular el lkp_CUSTOMER puertos a ODS_CUSTOMER_ACTIVE puertos para completar la transformación requerida donde ODS_CUSTOMER_ACTIVE es el archivo de destino requerido:
- El mapa icónico final que incluye la transformación de búsqueda debe ser el siguiente:
Transformación de expresión
La transformación de expresión es una transformación de Informatica pasiva y conectada. Las transformaciones de expresión se utilizan para la manipulación por filas. Para cualquier tipo de manipulación que desee realizar en un registro individual, utilice una transformación de expresión. La transformación de expresión acepta los datos por filas, los manipula y los pasa al destino. Por ejemplo, para calcular el descuento para cada producto o para concatenar nombres y apellidos o convertir fechas en un campo de cadena.
Transformación Joiner
La transformación de unión es una transformación de Informatica activa y conectada que se utiliza para unir dos fuentes heterogéneas. La transformación de combinación une orígenes en función de una condición especificada que coincide con uno o más pares de columnas entre los dos orígenes. Las dos canalizaciones de entrada incluyen una canalización o rama principal y una de detalle. Para unir más de dos fuentes, debe unir la salida de la transformación de unión con otra fuente. Para unir n números de fuentes en un mapeo, necesita n-1 transformaciones de unión. La transformación Joiner admite los siguientes tipos de combinaciones:- Normal
- Maestro exterior
- Detalle exterior
- Exterior completo
No podemos unir más de dos fuentes utilizando un solo ensamblador. Para unir tres fuentes, necesitamos tener dos transformaciones de unión.
Digamos que queremos unir tres tablas (Empleados, Departamentos y Ubicaciones) usando Joiner. Necesitaremos dos carpinteros. Joiner-1 se unirá, Empleados y departamentos y Joiner-2 se unirá, el resultado de la tabla Joiner-1 y Ubicaciones.
Estos son los pasos:
- Traiga tres fuentes al diseñador de mapas.
- Cree el Joiner -1 para unirse a Empleados y Departamentos usando Department_ID.
- Cree el siguiente ensamblador, Joiner-2. Tome la salida de Joiner-1 y los puertos de la tabla de ubicaciones y llévelos a Joiner-2. Une estas dos fuentes de datos usando Location_ID.
- El último paso es enviar elpuertosdel Joiner-2 al objetivo o mediante una expresióntransformacióna la mesa de destino.
Transformación sindical
La Union Transformation es una transformación de Informatica activa y conectada. Se utiliza para fusionar varios conjuntos de datos de varios flujos o canalizaciones en un solo conjunto de datos. Esta transformación de Informatica funciona de manera similar al comando UNION ALL en SQL, pero no elimina ninguna fila duplicada. Se recomienda utilizar un agregador para eliminar duplicados que no se esperan en el destino.
Transformación de normalizador
Normalizador La transformación es una transformación de Informatica activa y conectada. Es una de las transformaciones de Informatica más utilizadas principalmente con fuentes COBOL donde la mayor parte del tiempo los datos se almacenan en formato desnormalizado. Además, la transformación de normalizador se puede utilizar para crear varias filas a partir de una única fila de datos.
Intentemos cargar un archivo sin formato de datos separados por comas desde un archivo sin formato / Cobol Source.
Estos son los pasos:
- Comience cargando la Tienda (archivo plano) con el nombre de la tienda y los ingresos trimestrales:
- Cree una nueva transformación de Normalizador llamada NRM_STORE_EXP con dos puertos Store y Quarter (se repite 4 veces porque tenemos datos de 4 trimestres) como se ve a continuación:
- La pestaña de puertos debe ser como se ve a continuación:
- Copie / vincule las siguientes columnas y conéctese a la transformación del normalizador.
Tienda
Trimestre1
Trimestre2
Trimestre3
Trimestre4
El mapeo debería verse como sigue: - Cree una nueva transformación de expresión con exp_STORE . Copie / vincule las siguientes columnas y conéctese a la transformación de expresión como se muestra a continuación:
Tienda
Trimestre
GK_QUARTER
GCID_QUARTER - Vincule la expresión al objetivo final para completar el mapeo utilizando la transformación de normalización.
Transformación XML
Las transformaciones XML son una transformación de Informatica activa y conectada. En las transformaciones de Informatica, la transformación XML se utiliza principalmente cuando el archivo de origen es de tipo XML o los datos son de tipo XML. La transformación XML se puede clasificar principalmente en 3 transformaciones:
- Transformación de calificador de fuente XML.
- Transformación del analizador XML.
- Transformación del generador XML.
Calificador de origen XML Transformación : XML Source Qualifier es una transformación activa y conectada. El calificador de origen XML se utiliza solo con una definición de origen XML. Representa los elementos de datos que lee Informatica Server cuando ejecuta una sesión con fuentes XML. XML Source Qualifier tiene un puerto de entrada o salida para cada columna de la fuente. Si elimina una definición de origen XML de una asignación, Designer también elimina la transformación de calificador de origen XML correspondiente.
Transformación del analizador XML: La transformación del analizador XML es una transformación activa y conectada. La transformación del analizador XML se utiliza para extraer XML dentro de una canalización y luego pasarlo al destino. El XML se extrae de los sistemas de origen, como archivos o bases de datos. La transformación del analizador XML lee datos XML desde un único puerto de entrada y escribe datos en uno o más puertos de salida.
Transformación del generador XML: XML Generator es una transformación activa y conectada. La transformación del generador XML se utiliza para crear XML dentro de una canalización. XML Generator Transformation lee datos de uno o más puertos de entrada y genera XML a través de un único puerto de salida.
Transformación de rango
La transformación de rango es una transformación activa y conectada. Es una transformación de Informatica que le ayuda a seleccionar el rango de datos superior o inferior. Por ejemplo, para seleccionar las 10 regiones principales donde el volumen de ventas fue muy alto o para seleccionar los 10 productos con el precio más bajo.
Considere que desea cargar el primer y último registro en una tabla de destino de mi base de datos de empleados. La idea detrás de esto es agregar un número de secuencia a los registros y luego tomar el rango 1 superior y el 1 rango inferior de los registros.
que es un error clave
- Arrastre y suelte puertos desde el calificador de origen a dos transformaciones de rango.
- Cree un generador de secuencia reutilizable que tenga el valor inicial 1 y conecte el siguiente valor a ambas transformaciones de rango.
- Establezca las propiedades de rango de la siguiente manera. El puerto de secuencia recién agregado debe elegirse como Puerto de rango. No es necesario seleccionar ningún puerto como Grupo por puerto.Rango - 1
- Rango - 2
- Haz dos instancias del objetivo.Conecte el puerto de salida al objetivo.
Transformación de enrutador
El enrutador es una transformación activa y conectada. Es similar a la transformación de filtros. La única diferencia es que la transformación del filtro elimina los datos que no cumplen con la condición, mientras que el enrutador tiene una opción para capturar los datos que no cumplen con la condición. Es útil probar múltiples condiciones. Tiene grupos de entrada, salida y por defecto.
Supongamos que desea separar los registros pares e impares de una tabla, esto se puede hacer mediante una transformación de enrutador.
La idea es agregar un número de secuencia a los registros y luego dividir el número de registro por 2. Si es divisible, muévalo al objetivo par y, si no, muévalo al objetivo impar.
- Arrastre la fuente y conéctese a una transformación de expresión.
- Agregue el siguiente valor de un generador de secuencia a la transformación de expresión.
- En la transformación de expresión, haga dos puertos, uno es 'impar' y otro 'par'.
- Escribe la expresión como se muestra a continuación
- Conecte una transformación de enrutador a la expresión.
- Haga dos grupos debajo de la transformación del enrutador.
- Dar la condición de la siguiente manera
- Luego envíe a los dos grupos a diferentes objetivos. Este es el flujo completo.
Espero que este blog de Transformación de Informatica haya sido útil para comprender mejor las distintas transformaciones de Informatica y haya generado suficiente interés para aprender más sobre Informatica.
Si este blog le resultó útil, también puede consultar nuestra serie de blogs de tutoriales de Informatica y Tutorial de Informatica: Comprensión de Informatica 'de adentro hacia afuera' .En caso de que esté buscando detalles sobre la certificación de Informatica, puede consultar nuestro blog Certificación de Informatica: todo lo que hay que saber .
Si ya ha decidido emprender Informatica como carrera, le recomendaría por qué no eche un vistazo a nuestra página del curso. La capacitación de Certificación de Informatica en Edureka lo convertirá en un experto en Informatica a través de sesiones dirigidas por un instructor en vivo y capacitación práctica utilizando casos de uso de la vida real.