Wymiary wolno zmienne - SCD
Wymiary wolno zmienne pozwalają na śledzenie zmian w danych, które następują w wymiarze czasu i determinują jak ten proces jest realizowany.
Implementacja mechanizmu SCD sprawia, że użytkownicy mogą otrzymać odpowiedź na pytanie jaką wartość miałą dana zmienna w danym wymiarze czasu.
Typy Wymiarów wolno zmiennych w architekturze hurtowni danych:
- Scd Typ 0 jest stosunkowo rzadko używany, jako że według tego podejścia zmiany danych w czasie nie są w żaden sposób zapamiętywane. W tym przypadku niektóre dane mogą zostać nadpisane, inne zostają niezmienione w czasie, co owocuje sprzecznością w logice danych.
- Wymiar SCD Typu 1 to sytuacja, gdzie w bazie danych nie jest przechowywana historia zmian. Po prostu istniejące dane są nadpisane nowymi danymi. To podejście jest stosowane w sytuacjach, gdy zmiana danych jest spowodowana ich korektą lub wynikiem akcji czyszczenia danych (przykładowo literówki, wycinanie niepotrzebnych spacji, znaków specjalnych, itp.).
Wymiar ten jest łatwy w utrzymaniu i implementacji i powinien być używany wtedy, gdy utrata możliwości śledzenia zmian nie jest problemem.
- W modelu SCD Typu 2 kompletna historia zmian jest przechowywana w bazie danych. Wraz z kolejną zmianą jakiegokolwiek z wymiarów, tworzony jest dodatkowy rekord w tabeli wymiarów. W tym modelu tabela bazy danych zawiera przeważnie pola 'data efektywna' i 'rekord bieżący', za pomocą których można w łatwy sposób śledzić zmiany.
- W wymiarze SCD Typu 3 przechowywana jest informacja o poprzedniej wartości rekordu w bazie danych.
W tabeli wymiarów tworzy się z reguły kolumnę 'wartosc_poprzednia', która przechowuje wartość zmiennej przed uaktualnieniem. Rozwiązanie to jest szybkie, ponieważ można szybko odpowiedzieć na pytanie jaka była wartość zmiennej przed i po zmianie.
Jednak w wymiarze typu 3 nie można śledzić wszystkich zmian historycznych, np. wtedy, gdy wartość wymiaru zmienia się dwa lub więcej razy. W tym momencie trzebaby utworzyć kolejne kolumny, co może skomplikować znacznie architekturę bazy danych.
- Koncepcja wymiaru SCD Typu 4 polega na tym, że tworzy się nową tabelę danych w hurtowni danych do przechowywania historii dla każdego z wymiarów.
W praktyce, w dużych producyjnych systemach hurtowni danych, głównie stosowana jest architektura typu SCD 1, SCD 2 i SCD 3. Często stosowaną praktyką jest także stosowanie różnych modeli SCD do różnych tabeli wymiarów hurtowni danych, w zależności od potrzeb biznesowych.