Katalog przedmiotów

Hurtownie danych

Cele
Celem kształcenia jest przekazanie studentom wiedzy teoretycznej i umiejętności praktycznych z dziedziny projektowania, budowy i obsługi obszernych repozytoriów danych analitycznych. Poznawany materiał stanowi rozszerzenie wiedzy o relacyjnych i nie relacyjnych bazach danych. Podczas laboratorium studenci uzyskują również dodatkową wiedzę teoretyczną i umiejętności praktyczne związane z obsługą systemu RDBMS Oracle 9i.

Zakres
Podstawy teoretyczne technologii hurtowni danych. Wprowadzenie podstaw teoretycznych technologii tworzenia i obsługi systemów hurtowni danych. Definicje podstawowych pojęć. Narodziny nowej generacji systemów baz danych – OLAP. Podstawowe cechy hurtowni danych. Porównanie systemów OLTP i OLAP. Schemat przepływu informacji w Systemie Hurtowni Danych. Typowe struktury logiczne: Gwiazda i Płatek Śniegu. Tablice Faktów, Tablice Wymiarów, Hierarchie Wymiarów. Analiza danych - drążenie wymiarów. Struktura logiczna i struktura fizyczna hurtowni danych. Etapy tworzenia struktury fizycznej hurtowni Danych. Technologie transportu danych. Definicje podstawowych metod eksportu danych z systemów operacyjnych i importu do systemu hurtowni danych. Przenoszenie danych w plikach tekstowych. Mechanizm tabel zewnętrznych. Przenoszenie danych w plikach binarnych. Przenoszenie danych przy pomocy sieci komputerowych: bramy heterogeniczne, transakcje rozproszone. Tworzenie struktury fizycznej i logicznej systemu hurtowni danych. Definicje założeń tworzenia i obsługi obszaru oczyszczania. Budowanie obszaru oczyszczania. Zasilanie danymi. Rozwiązywanie podstawowych problemów, związanych z migracją, transformacją i kontrolą poprawności danych. Tworzenie struktury logicznej i fizycznej Tabeli Wymiarów w układzie Gwiazdy i Płatka Śniegu. Tworzenie struktury logicznej i fizycznej Tabeli faktów. Weryfikowanie poprawności hierarchii wymiarów. Wprowadzanie zmian do struktur logicznych. Optymalizacja działania hurtowni danych. Podstawy działania optymalizatora zapytań, polecenie „Describe plan for”. Tworzenie zmaterializowanych perspektyw (Migawki). Testowanie mechanizmu przepisywania zapytań (Query Rewrite). Podstawowe rozszerzenia OLAP języka SQL. Rozszerzenia funkcji grupujących (CUBE, ROLLUP, GROUPING). Funkcje szeregujące (RANK, DENSE_RANK). Optymalizacja struktury fizycznej hurtowni danych. Podstawy teoretyczne partycjonowania danych. Partycjonowanie zakresowe. Partycjonowanie mieszające. Wykorzystanie indeksów drzewiastych. Wykorzystanie indeksów bitmapowych. Zastosowania indeksów globalnych i lokalnych. Kontrolowanie rodzajów aktywności ograniczeń. Przenoszenie danych przy pomocy tworzenia i dołączania partycji tabel. Sterowanie aktywnością zestawu ograniczeń. Tworzenie i obsługa wielowymiarowe bazy danych na przykładzie systemu Oracle EXPRESS. Podstawy teoretyczne działania, wymagania i administracja. Tworzenie przykładowych hipersześcianów danych: budowanie wymiarów i ich hierarchii, definiowanie faktów. Zasilanie bazy wielowymiarowej danymi z plików tekstowych przy pomocy kreatorów. Zasilanie bazy wielowymiarowej danymi z bazy relacyjnej: konfigurowanie połączenia ODBC, mapowanie faktów i wymiarów. Obsługa programu Oracle Warehouse Builder. Podstawy obsługi i działania. Obsługa warstwy logicznej i fizycznej systemu hurtowni. Konfigurowanie połączeń ze źródłami danych i mapowanie procesu zasilania danych. Tworzenie struktur Data Mart: budowanie wymiarów i ich hierarchii, definiowanie faktów. Indywidualny projekt repozytorium informacyjnego Hurtowni Danych.

Literatura podstawowa
1. Data Warehousing Guide - dokumentacja serwera Oracle 9.2, pozycja A96520-01.
2. The Oracle Data Mart Cookbook - dokumentacja programu Oracle Warehouse Builder.
3. OWB User’s Guide - dokumentacja programu Oracle Warehouse Builder.
4. Database Administration Guide - dokumentacja programu Oracle Expres.

Literatura uzupełniająca
1. V. Poe, P. Klauer, S. Brobst: Tworzenie hurtowni danych, WNT.
2. C. Todman: Projektowanie hurtowni danych. Zarządzanie kontaktami z klientami (CRM), WNT, 2003.
3. S. Schaffer, A. R. Simon: Hurtownie danych i systemy informacji gospodarczej, Oficyna Ekonomiczna 2002.

Punkty ECTS
4 - niestacjonarne,
4 - stacjonarne

Rodzaje studiów, na których przedmiot jest realizowany
niestacjonarne - 1-go stopnia,
niestacjonarne - 2-go stopnia (mgr uzup.),
stacjonarne - 1-go stopnia,
stacjonarne - 2-go stopnia (mgr uzup.)

Specjalności, na których przedmiot jest realizowany
Bazy danych,
Inteligencja komputerowa

Prowadzący
mgr inż. Rafał Kowalski