Tutorial de Informatica: Comprensión de Informatica 'de adentro hacia afuera'



Este blog del tutorial de Informatica explicará Informatica PowerCenter en detalle, la arquitectura de Informatica y cómo crear un dominio en Informatica.

Aprendimos en el último blog sobre y su aplicación en la vida real.Profundicemos ahora y comprendamos en este blog tutorial de Informatica sobre Informatica, su arquitectura y un caso de uso. es una de las habilidades más concentradas en el mercado actual, ya que es una plataforma de integración de datos única e imparcial que interactúa en una amplia gama de estándares, sistemas y aplicaciones dispares.Como se discutió en el último blog, Informatica PowerCenter es el producto estrella de Informatica y, a menudo, se usa indistintamente. En resumen, Informatica Powercenter es una plataforma de integración de datos empresariales única y unificada que permite a las empresas y organizaciones gubernamentales de todos los tamaños acceder, descubrir e integrar datos de prácticamente cualquier sistema empresarial, en cualquier formato y entregar esos datos en toda la empresa a cualquier velocidad. . Es una herramienta ETL (Extraer, Transformar y Cargar) con sus principales ventajas sobre otras herramientas ETL son las siguientes:

  • Es robusto y se puede utilizar tanto en Windows como en sistemas basados ​​en UNIX.
  • Es de alto rendimiento pero muy simple de desarrollar, mantener y administrar

Tutorial de Informatica: comprensión de Informatica PowerCenter

Para comprender Informatica en tiempo real, debemos comprender en profundidad la Arquitectura de Informatica y otros componentes de Informatica. Por tanto, al final de este blog del tutorial de Informatica, podrá comprender lo siguiente:





  1. ¿Qué es la Arquitectura de Informatica?
    1. Componente cliente de Informatica
      1. Administrador de repositorio de Informatica PowerCenter
      2. Diseñador de Informatica PowerCenter
      3. Administrador de flujo de trabajo de PowerCenter
      4. Monitor de flujo de trabajo de PowerCenter
      5. Administrador de consola
    2. Componente de servidor de Informatica
      1. Servicio de repositorio
      2. Servicio de integracion
      3. Servicio SAP BW
      4. Centro de servicios web
  2. Flujo de datos en Informatica
  3. Dominio y nodos de Informatica
  4. Gerente de Servicios y Servicios de Informatica
  5. Caso de uso: Cómo cargar la tabla de dimensiones del producto usando SCD

¿Qué es la Arquitectura de Informatica?

La arquitectura de Informatica PowerCenter se basa en el concepto de Arquitectura orientada a servicios (SOA). Una arquitectura orientada a servicios (SOA) se puede definir como un grupo de servicios que se comunican entre sí. El proceso de comunicación implica una simple transferencia de datos o podría involucrar dos o más servicios que coordinen la misma actividad.

El desarrollo de Informatica se basa en técnicas de desarrollo basadas en componentes. El desarrollo basado en componentes es una técnica en la que se utilizan componentes predefinidos o unidades funcionales, o ambas, con funcionalidades específicas para ensamblar el producto final. PowerCenter sigue las metodologías de desarrollo basadas en componentes al permitir crear un flujo de datos desde un origen hasta el destino, utilizando diferentes componentes (llamados transformaciones) y vinculándolos entre sí según sea necesario. Una buena forma de hacerlo sería comprender primero cuáles son los componentes de Informatica y luego aprenderemos cómo aplicar Informatica para resolver un problema comercial típico a través de un caso de uso.



Por tanto, la herramienta Informatica PowerCenter consta de 2 componentes. Son:

  • Componente cliente
  • Componente del servidor
Informatica-tutorial-Informatica-Architecture

Fig: Descripción general de la arquitectura de Informatica

Componentes de cliente de Informatica PowerCenter:

  • Administrador de repositorio de PowerCenter:

Repository Manager se utiliza para administrar repositorios. Puede administrar usuarios y grupos. Podemos crear, eliminar y editar usuarios y grupos de usuarios del repositorio. También podemos asignar y revocar privilegios de repositorio y permisos de carpeta.



El Repository Manager tiene las siguientes ventanas:

  • Navegador: Muestra todos los objetos que crea en el Administrador de repositorios, el Diseñador y el Administrador de flujo de trabajo. Está organizado primero por repositorio y luego por carpeta.
  • Principal: Proporciona propiedades del objeto seleccionado en el navegador. Las columnas de esta ventana cambian según el objeto seleccionado en el navegador.
  • Salida: Proporciona el resultado de las tareas ejecutadas dentro del Repository Manager.

Fig: Administrador de repositorio

  • Diseñador de Informatica PowerCenter

PowerCenter Designer es el cliente donde especificamos cómo mover los datos entre varios orígenes y destinos. Aquí es donde interpretamos los diversos requisitos comerciales mediante el uso de diferentes componentes de PowerCenter llamados transformaciones y pasamos los datos a través de ellos (transformaciones). El diseñador se utiliza para crear definiciones de origen, definiciones de destino y transformaciones, que se pueden utilizar más para desarrollar asignaciones.

Figura: Diseñador de Informatica PowerCenter

  • Administrador de flujo de trabajo de Informatica PowerCenter

    Es un conjunto ordenado de una o más sesiones y otras tareas, diseñado para lograr un propósito operativo general. Es executa una serie de asignaciones (como sesiones) y otras tareas.

Fig: Administrador de flujo de trabajo

Workflow Manager es la aplicación de PowerCenter que permite a los diseñadores crear y ejecutar flujos de trabajo. Se puede abrir de la siguiente manera:

  • Se puede iniciar desde Designer haciendo clic en el icono 'W'
  • Se puede abrir independientemente de la ruta Inicio> Todos los programas> Informatica PowerCenter 9.6.1> Cliente> Cliente de PowerCenter> PowerCenter Workflow Manager
  • Se puede abrir desde el Diseñador de flujo de trabajo: la herramienta que usa para crear objetos de flujo de trabajo

Fig: Interfaz de Workflow Manager

El Administrador de flujo de trabajo muestra las siguientes ventanas para ayudarlo a crear y organizar flujos de trabajo:

  • Puede conectarse y trabajar en varios repositorios y carpetas. En el navegador, el administrador de flujo de trabajo muestra un icono rojo sobre los objetos no válidos.
  • Puede crear, editar y ver tareas, flujos de trabajo y worklets.
  • Contiene pestañas para mostrar diferentes tipos de mensajes de salida. La ventana Salida contiene las siguientes pestañas:
    • Muestra mensajes cuando guarda un flujo de trabajo, un worklet o una tarea. La pestaña Guardar muestra un resumen de validación cuando guarda un flujo de trabajo o un worklet.
    • Obtener registro. Muestra mensajes cuando Workflow Manager recupera objetos del repositorio.
    • Muestra mensajes cuando valida un flujo de trabajo, un worklet o una tarea.
    • Muestra mensajes cuando copia objetos del repositorio.
    • Muestra mensajes del servicio de integración.
    • Muestra mensajes del servicio de repositorio.

Diseñador de flujo de trabajo de Informatica

Asigna el orden de ejecución y las dependencias de sesiones, tareas y worklets para el servidor de Informatica.

Fig: Diseñador de flujo de trabajo

  • Desarrollador de tareas

Crea tareas de sesión, comando de shell y correo electrónico. Las tareas creadas en Task Developer son reutilizables

  • Diseñador de Worklet

Crea objetos que representan un conjunto de tareas. Los objetos Worklet son reutilizables.

Workflow Manager también muestra una barra de estado que muestra el estado de la operación que realiza.

La siguiente figura ilustra cómo se ve un flujo de trabajo típico, incluidos los componentes de tarea Inicio, Enlace y Tarea de sesión.

Fig: Ejemplo de Workflow Manager

  • Monitor de flujo de trabajo de Informatica PowerCenter

Workflow Monitor, una herramienta de PowerCenter, se utiliza para supervisar la ejecución de flujos de trabajo y tareas.

Workflow Monitor se puede utilizar para:

pmi-acp vale la pena
  • Ver detalles sobre un flujo de trabajo o una tarea ejecutada en la vista de diagrama de Gantt o en la vista de tareas
  • Ejecutar, detener, cancelar y reanudar flujos de trabajo o tareas
  • El monitor de flujo de trabajo muestra los flujos de trabajo que se han ejecutado al menos una vez.
  • El monitor de flujo de trabajo recibe continuamente información del servicio de integración y el servicio de repositorio. También obtiene información del repositorio para mostrar información histórica.

Fig: Monitor de flujo de trabajo

Cómo abrir el Monitor de flujo de trabajo de Informatica:

Para abrir el Monitor de flujo de trabajo, vaya a:

Inicio> Todos los programas> lnformatica PowerCenter 9.6.1> Cliente> Cliente de PowerCenter> Monitor de flujo de trabajo de PowerCenter

El monitor también se puede abrir:

  • Desde el navegador de Workflow Manager
    • El Administrador de flujo de trabajo se puede configurar para abrir el Monitor de flujo de trabajo cuando se ejecuta un flujo de trabajo desde el Administrador de flujo de trabajo.
    • Desde Herramientas> Monitor de flujo de trabajo en Designer, Workflow Manager o Repository Manager
  • O, desde el icono de Monitor de flujo de trabajo en la barra de herramientas Herramientas

Fig: Secciones del monitor de flujo de trabajo

  • InformaticaAdministrador de consola

La consola de administrador de Informatica (herramienta de administrador) es la herramienta de administración para administrar el dominio de Informatica y la seguridad de Informatica.La consola de administrador de Informatica (la herramienta de administrador) está disponible después de la instalación de Informatica.

Fig: Consola de administrador de Informatica

La Consola de administración realiza las siguientes tareas en el dominio:

  • Gestión de servicios de aplicaciones: Gestiona todos los servicios de aplicaciones del dominio, incluido el servicio de integración y el servicio de repositorio.
  • Configuración de nodos: Configura las propiedades del nodo, incluido el directorio y los recursos de respaldo. Permite que los nodos se apaguen y luego se reinicien también cuando sea necesario.
  • Gestionar objetos de dominio: Crea y gestiona objetos como servicios, nodos, licencias y carpetas.
  • Ver y editar las propiedades del objeto de dominio: Permite visualizar y editar las propiedades de todos los objetos del dominio.
  • Tareas administrativas de seguridad: Administre usuarios, grupos, roles y privilegios.
  • Visualización de eventos de registro: Utiliza el visor de registros para ver los eventos de registro del dominio, el servicio de integración, el servicio SAP BW, el centro de servicios web y el servicio de repositorio.

Fig: Consola de administrador-Interfaz

Entonces, en pocas palabras, el componente cliente de Informatica consta de 5 componentes, a saber. Informatica Repository Manager, Informatica PowerCenter Designer, Informatica Workflow Manager, Informatica Workflow Monitor y Informatica Administrator Console. Forma el encofrado de toda la herramienta. Intentemos ahora comprender el componente de servidor de Informatica PowerCenter.

Componentes del servidor de Informatica PowerCenter

Los componentes del servidor de PowerCenter se componen de los siguientes servicios:

  • Servicio de repositorio: El servicio de repositorio gestiona el repositorio. Recupera, inserta y actualiza metadatos en las tablas de la base de datos del repositorio.
  • Servicio de integración: El servicio de integración ejecuta sesiones y flujos de trabajo.
  • Servicio SAP BW: El servicio SAP BW busca solicitudes RFC de SAP BW e inicia flujos de trabajo para extraer datos o cargar datos en SAP BW.
  • Centro de servicios web: El concentrador de servicios web recibe solicitudes de clientes de servicios web y expone los flujos de trabajo de PowerCenter como servicios.

Ahora que hemos entendido los componentes de cliente y servidor de Informatica, el siguiente gráfico de información explicará el flujo de datos en Informatica, es decir, cómo se procesan los datos:

Fig: Flujo de datos en Informatica

Es muy lógico en este punto entender cuáles son otras unidades fundamentales en Informatica como Domain & Node, Service & Service Manager. Así que tomemos un momento para comprenderlos antes de realizar una revisión de Informatica.

Dominio y nodos de Informatica:

Las características más destacadas de un dominio son las siguientes:

  • Un dominio es una colección lógica o un conjunto de nodos y servicios.
  • El dominio de PowerCenter es la unidad administrativa fundamental de PowerCenter
  • Un dominio puede ser una sola instalación de PowerCenter o puede constar de varias instalaciones de PowerCenter

Las características más destacadas de un nodo son las siguientes:

  • Un nodo es una representación lógica de una máquina física. Tiene atributos físicos como un nombre de host y un número de puerto
  • Cada nodo ejecuta un administrador de servicios que es responsable de la aplicación y los servicios centrales.
  • Un nodo puede ser un nodo de puerta de enlace o un nodo trabajador, pero solo puede pertenecer a un dominio

Fig: Nodo de dominio n de Informatica

Gerente de Servicios y Servicios de Informatica:

Un servicio es un recurso que proporciona funciones especializadas. Todos los procesos de PowerCenter se ejecutan como servicios en un nodo.

Informatica PowerCenter tiene dos tipos de servicios:

  • Los servicios de aplicaciones representan funciones basadas en servidor, incluidos los servicios de repositorio e integración.
  • Los servicios principales representan funciones que administran y mantienen el entorno en el que opera PowerCenter e incluyen servicios como el servicio de registro, el servicio de licencias y el servicio de dominio, entre muchos otros.

Supervisor

  • El Administrador de servicios es un servicio que administra todas las operaciones del dominio y se ejecuta en cada nodo dentro de un dominio.
  • En el nodo de puerta de enlace, el administrador de servicios es responsable de lo siguiente:
    • Controlando el dominio
    • Administrar los servicios que se ejecutan en el dominio
    • Proporcionar búsqueda de servicios
  • En todos los nodos, el Administrador de servicios está destinado a controlar los servicios básicos y los servicios de aplicaciones.

Cómo interactúan los diferentes componentes de PowerCenter:

Fig: Interacción de los componentes de Informatica

Caso de uso: Cómo cargar una tabla de dimensiones de producto usando SCD

Planteamiento del problema: Nuestro objetivo es cargar una tabla de dimensiones del producto utilizando Dimensiones de cambio lento (SCD) Tipo 2 utilizando la fecha de vigencia.

Dado un sistema de origen de clientes que contiene los detalles de ID de cliente, nombre, ciudad, estado y país de los clientes, debemos crear una nueva entrada en la tabla de dimensiones de destino cada vez que un cliente viene con un valor diferente.

Para comprender esto mejor, si un cliente regresa con un valor diferente para el estado o la ciudad en comparación con el valor ya presente en la tabla de dimensiones de destino, se debe crear una nueva entrada con el valor actualizado. Esto se logra mediante el uso de la tabla de objetivos basada en la solución SCD.

A continuación se muestra un proceso paso a paso para cargar la tabla de dimensiones del producto usando SCD.

Paso 1 : Abra PowerCenter Designer.

Paso 2 : Conectarse al repositorio

Fig: Estableciendo conexión con el repositorio

Paso 3 : Inicie el diseñador

Fig: Inicio de PowerCenter Designer

Etapa 4: Cargar la fuente desde la base de datos

Fig: Varias opciones para cargar el conjunto de datos fuente

Paso 5: Conectarse a la base de datos

Paso 6: Seleccione la tabla SCD_INPUT_DATA

Paso 7: De manera similar, cargue el conjunto de destino de la base de datos

Fig: Varias opciones para conjuntos de objetivos

Paso 8 : Diseñe un flujo de trabajo para realizar la operación requerida como se ve a continuación

Fig: Diseño de flujo de trabajo para base de datos

Paso 9 : Inicie Oracle SQL Developer y cargue SCD_CUSTOMER mesa

Fig: Tabla SCD_CUSTOMER

que es un hilo de demonio

Paso 10 : Modificar los valores de estado para los clientes Mary y Hannah

Fig: Modificando valores de Mary

Fig: Modificación de valores de Hannah

Paso 11 : Inicia el monitor de flujo de trabajo y ejecuta el flujo de trabajo

Fig: Ejecución del flujo de trabajo

Fig: Salida del flujo de trabajo

Paso 12: Ejecute el siguiente comando para obtener la base de datos de destino

  • seleccionar * de scd_customer_target

Fig: Ejecución de una consulta SQL para resultados específicos

Paso 13: Salida de la tabla de dimensiones del producto

Fig: Tabla de dimensiones del producto Salida

Para concluir, la tabla de productos cargada contiene valores históricos de los datos que incluyen la variación de los valores presentes y esto se obtiene utilizando Informatica PowerCenter.

Espero que este blog de tutoriales de Informatica haya sido útil para construir su base de Informatica y haya generado suficiente interés para aprender más sobre Informatica.

Si ya ha decidido emprender Informatica como carrera, le recomendaría por qué no eche un vistazo a nuestra página del curso. La capacitación de Certificación de Informatica en Edureka lo convertirá en un experto en Informatica a través de sesiones dirigidas por un instructor en vivo y capacitación práctica utilizando casos de uso de la vida real.

Tienes una pregunta para nosotros? Menciónalo en la sección de comentarios y nos comunicaremos contigo.