Fundamentos de DataStage
DataStage es una herramienta ETL que permite crear y mantener fácil y rápidamente almacenes de datos procedentes de sistemas de Aplicaciones Empresariales incluyendo SAP, Siebel, Oracle y PeopleSoft CRM y de otros sistemas relacionados al negocio.
Datastage soporta la extracción, integración y transformación de altos volúmenes de datos desde estructuras simples hasta muy complejas.
Entre funciones de DataStage, la más destacada es el diseño de tareas que extraen, integran, agregan, cargan y transforman los datos para el Data Warehouse o Data Mart. Las tareas son compiladas para crear ejecutables que son calendarizados por el Director y ejecutadas por el Servidor.
Historia Datastage
Antes el producto se llamaba Ardent DataStage, luego adquirido por Ascential y en 2005 lo compró IBM. Desde entonces su nombre oficial es IBM WebSphere Datastage.
Versiones Datastage
DataStage es un software cliente/servidor. Entre otras plataformas soportadas hay Windows y Unix (IBM AIX).
Ediciones Datastage:
- Server Edition: server jobs (DS 7.5.1 server edition usado para el tutorial)
- Enterprise Edition - las tareas paralelas y server (parallel and server jobs)
- MVS Edition - soporta los jobs mainframe que son programadas en la plataforma Windows o Unix/Linux, compiladas y transferidas al mainframe.
- DataStage for PeopleSoft: server edition con PeopleSoft EPM.
- DataStage TX - transacciones complejas.
- DataStage SOA - integración con los servicios SOA.
Componentes DataStage
Hay cuatro componentes principales de la herramienta Datastage:
- Administrator - Interfaz de usuario usada para configurar proyectos de Datastage y usuarios. Gestiona administración de proyectos de DataStage en ambientes de desarrollo y producción.
- Designer - usada para crear, diseñar y compilar tareas Datastage (también permite testear y ejecutar). Mayormente usado por los desarrolladores.
- Director - para validar, calendarizar, testear, ejecutar y monitorizar jobs Datastage. Usado por los operadores y los testers.
- Manager - interfaz de usuario usada para visualizar y editar el contenido del repositorio.