Esquema estrellaEsquema copo de nieveEsquema constelación

Almacén de datos - concepto

Almacén de datos (Bodega de Datos, Data warehouse) es una integrada colección de datos que contiene datos procedentes de sistemas del planeamiento del recurso de la empresa (SAP, CRM, ERP) y de otros sistemas relacionados al negocio. Los almacenes de datos contienen a menudo datos y parámetros introducidos manualmente para mantener configuración solicitada.
Los almacenes de datos contienen información que se subdivide a veces en unidades lógicas más pequeñas, llamadas los centros comerciales (data marts).
Almacén de datos contiene datos usados en operaciones diarias para la ayuda en la toma de decisiones, para el análisis y para controlar.
La base de datos esta actualizada periódicamente sin interrumpir funcionamiento de los sistemas relacionados al negocio (múltiples fuentes).
El almacén de datos puede ser implementado en una arquitectura de base de datos (como Oracle, SQL Server) o en un producto dedicado (Teradata por ejemplo).



Arquitectura de un sistema de almacén de datos

Un Almacén de Datos (Data Warehouse) es una colección de datos que está formada por Variables (hechos, facts) y Dimensiones (dimensions). Dimensiones son los elementos para ubicar datos que participan en el análisis y Variables los valores que se desean analizar.
La mayor diferencia entre la arquitectura de un almacén de datos y una base de datos OLTP estándar, conteniendo datos de los sistemas del planeamiento del recurso de la empresa (como SAP, CRM) es que en una estructura de bodega de datos las tablas están denormalizadas entre variables y dimensiones.

En un típico sistema de bases de datos OLTP (On-line Transaction Processing) lo más importante para el funcionamiento deseado es que el diseño de base de datos sea eficiente. Esto determina si el sistema es útil para los usuarios y si funciona de modo rápido y eficaz.
Este tipo de base de datos tiene que encargarse de insertar miles de filas de datos cada hora. Por eso se optimiza la base de datos para guardar datos lo menos posible y ejecutar rápidamente las instrucciones sql: INSERT, UPDATE y DELETE.

Almacén de Datos, al contrario de OLTP, es un sistema que debe dar una respuesta a casi cada pregunta con respeto al funcionamiento de la empresa. Una Bodega de datos es una base de datos que almacena información, la cual se construye a partir de datos básicos extraidos de otras bases de datos (operacionales). El motivo para producir información de una bodega de datos es ayudar a la toma de decisiones con la capacidad de realizar en tiempo real análisis multidimensionales Esta información tiene que ser accesible rápidamente, pero no es tan importante que sea lo mas actual posible y al nivel de detalle muy bajo. Normalmente un almacén de datos se carga diariamente durante la noche cuando los sistemas fuente no están sobrecargados. El objeto mayor de la arquitectura de un almacén de datos es guardar datos históricos y agregados. Las instrucciones SQL ejecutadas con mayor frecuencia son SELECT .

Hay tres arquitecturas del diseño de sistemas de almacenes de datos: