Hurtownia danych
Hurtownia danych jest centralnie zarządzaną i zintegrowaną bazą danych, gromadzącą dane z systemów i źródeł operacyjnych organizacji (takich jak systemy SAP, CRM, ERP).
Hurtownia danych może również zawierać ręcznie wprowadzane mapowania, parametry bądź kryteria w celu klasyfikacji danych.
Baza, na której oparta jest hurtownia danych zawiera dane będące źródłem analiz i do których użytkownicy mogą mieć bezpośredni dostęp.
Hurtownia danych może być uaktualniana o dowolnym czasie, bez konieczności wyłączania systemów operacyjnych lub produkcyjnych firmy. Jest to zapewnione dzięki zaimplementowaniu procesu ETL.
Źródłem hurtowni danych są dane pochodzące z tabel operacyjnych systemów przedsiębiorstwa. Dane przed załadowaniem do hurtowni są walidowane, czyszczone, transformowane i w rezultacie ładowane do hurtowni, po czym najczęściej agregowane i udostępniane na potrzeby raportowania.
Hurtownia danych jest dedykowaną bazą danych zawierającą szczegółowe, historyczne, stałe i spójne dane, które mogą być analizowane w zależności od zmiennej czasu.
W przypadkach, gdy tylko część danych jest poddawana analizie, warto rozważyć użycie data martów. Data mart jest generowany na bazie hurtowni danych i zawiera zagregowane dane zorientowane na jeden wybrany temat, które są często wyświetlane oraz łatwo i szybko dostępne dla użytkowników.
W sytuacji gdy dane zasilające hurtownię danych są wyselekcjonowane nieoptymalnie, baza może urosnąć do olbrzymich rozmiarów, przez co może stać się trudna w zarządzaniu i w efekcie nieużyteczna. Aby zapobiec temu problemowi dane powinny być w odpowiedni sposób agregowane (sumaryzowane).
Dobrze zaprojektowana i zarządzana hurtownia danych może znacząco poprawić jakość i dostępność danych dla użytkowników i zwiększyć ilość informacji do nich dostarczanych.