Data mart – tematyczna hurtownia danych

Data marty są tworzone w celu zapewnienia wsparcia procesu podejmowania decyzji osobom odpowiedzialnym za konkretny obszar biznesowy.

Hurtownia danych operuje na poziomie korporacyjnym danych, przy czym Tematyczna Hurtownia Danych jest używana z reguły przez jeden wydział i dane w niej zawarte dotyczą jednego konkretnego tematu biznesowego.

Typowa i najczęściej spotykana architektura korporacyjnej hurtowni danych składa się z jednej globalnej hurtowni danych i bezpośrednio zależnych i czerpniących z niej dane data martów.

Kluczową sprawą jest utrzymywanie spójności pomiędzy hurtownią danych a data martami w obszarze definicji, aktualizacji i zarządzania. Jeżeli warunki te nie zostaną spełnione, to misja hurtowni danych bycia źródłem ‘jedynej wersji prawdy’ będzie niemożliwa.

Czasami jednak zdarzają się przypadki, kiedy sensowne jest tworzenie data martu niezależnego od hurtowni danych. Zdarza się to najczęściej, gdy do utworzenia data martu wymagane jest dodatkowe źródło danych spoza hurtowni. Należy jednak pamiętać o tym, że tego typu architektura jest narażone na ryzyko niespójności i założenia te powinny być jasno komunikowane w organizacji.

Tematyczne hurtowni danych są zasilane i zarządzane przez procesy ETL i najczęściej utrzymywane w tym samym środowisku co główny model hurtowni danych (np. Oracle, Teradata, MS SQL Server, SAS) i udostępniane za pomocą tych samych narzędzi raportujących.
Jednak bardzo często spotyka się również sytuację gdzie użytkownicy końcowi potrzebują dostępu do data martów w trybie offline – wtedy generowane są one na serwerze i propagowane za pomocą dysków sieciowych, poprzez email lub z wykorzystaniem innego dedykowanego mechanizmu dystrybucji.

Znane są dwa podejścia przechowywania danych w data martach:

  • Datamarty bazodanowe – lub też ekstrakty w postaci plików tekstowych - jednowymiarowe, niezagregowane zbiory danych. Bardzo często przetwarzanie i agregacja danych odbywa się po stronie aplikacji do raportowania.
  • Wielowymiarowe tematyczne hurtownie danych (MDDB) – dane sumaryczne zorganizowane w strukturze wielowymiarowej. Kalkulacje wykonywane są tylko raz w momencie tworzenia struktury wielowymiarowej i gotowe do analiz biznesowych OLAP.


  • W kolejnym etapie dane z tematycznych hurtowni danych są udostępniane dla narzędzi raportowania lub OLAP, takich jak przykładowo: Hyperion, Cognos, Business Objects, Pentaho BI, Microsoft Excel.

    Data marty w praktyce

    Duże organizacje najczęściej utrzymują kilkanaście lub kilkadziesiąt data martów, na potrzeby finansów, marketingu, sprzedaży, operacji IT i innych zespołów w zależności od potrzeb.

    Przykłady użycia data martów w organizacji:
    Raportowanie CRM, analiza migracji klientów, planowanie produkcji, monitorowanie kampanii marketingowych, wskaźniki wydajności, zarządzanie ryzykiem, integracja z innymi systemami wykorzystującymi dane z hurtowni i inne specyficzne dla danej branży