SCD - Typ 2SCD - Typ 3 i 4

SCD Typu 1

Z wymiarem SCD Typu 1 mamy do czynienia wtedy, gdy w bazie danych nie jest przechowywana historia zmian. Istniejące dane są nadpisane nowymi danymi. To podejście jest stosowane w sytuacjach, gdy zmiana danych jest spowodowana ich korektą lub jest wynikiem czyszczenia danych (przykładowo literówki, konsolidacja danych, wycinanie niepotrzebnych spacji, znaków specjalnych, itp.).
Wymiar ten jest łatwy w utrzymaniu i implementacji i jest używany wtedy, gdy utrata możliwości śledzenia zmian nie jest problemem..

Implementacja SCD 1 w Datastage

Job opisany i przedstawiony poniżej pokazuje jak zaimplementować wolno zmieniające się wymiary (SCD) typu 1 w Datastage. Jest to jedna z wielu możliwych architektur pozwalających na zaimplementowanie tego zagadnienia. Poniższy przykład bazuje na jobie ładującym klientów do hurtowni danych.

SCD1 architektura
 SCD1 architektura


Job o nazwie CUST_SCD2 jest odpowiedzialny za zarządzanie zmiennością wymiarów. Należy zwrócić szczególną uwagę na:
  • Plik haszowany (Hash_NewCust), który pobiera nowe dane pochodzące z pliku tekstowego.
  • Transformer T001_Lookups wyszukuje dane w pliku hashed i mapuje nowe i stare wartości na osobne kolumny.
    SCD1 mapowanie
    SCD1 mapowanie
  • Transformer T002 nadpisuje stare wartości nowymi
    SCD1 nadpisanie wartosci
    SCD1 nadpisanie wartosci
  • Stage ODBC jest odpowiedzialny za uaktualnienie bazy danych (użyta jest metoda aktualnizacji 'update existing rows’, czyli zaktualizuj istniejące wiersze)