Detail předmětu

Datové sklady v prostředí Oracle

FIT-IOWAk. rok: 2015/2016

Koncepce datových skladů v prostředí Oracle, logický a fyzický model datového skladu, struktury pro efektivní tvorbu datových skladů, proces extrakce, transformace a vložení dat, SQL konstrukce pro datové sklady (agregace, analýza, sestavy, modely), prostředí Oracle Warehouse Builder, výkonnost datového skladu, přesun dat mezi datovými sklady.

Jazyk výuky

čeština

Počet kreditů

5

Výsledky učení předmětu

Student si osvojí základní pojmy a principy datových skladů, seznámí se s procesem extrakce, transformace a vložení dat do datového skladu. Dále se student seznámí s prostředím Oracle pro tvorbu datových skladů a naučí se je využívat pro vytváření reálných datových skladů.

Student bude schopný navrhnout datový sklad a vytvořit jej v prostředí nástrojů poskytovaných firmou Oracle.

Prerekvizity

Znalost relačních databázových systémů a jazyka SQL.

Způsob a kritéria hodnocení

Získání alespoň 50 bodů ze všech bodovaných aktivit.

Osnovy výuky

Osnova přednášek:
  1. Koncepce datových skladů v prostředí Oracle 11g - základní pojmy: datový sklad, ETL, OLTP a OLAP databáze, přístupy k vytváření datových skladů, fakta a dimenze.
  2. Logický a fyzický model datového skladu (1) - problematika modelování dat v datových skladech, pojmy obchodní, logický a fyzický model.
  3. Logický a fyzický model datového skladu (2) - fyzické modely datového skladu (schéma hvězdy, sněhové vločky), charakteristiky tabulek faktů a dimenzí, transformace mezi jednotlivými modely.
  4. Struktury pro efektivní tvorbu datových skladů - nastavení velikosti datového skladu, dělení dat, indexování, optimalizace, paralelizace, bezpečnost dat.
  5. Proces extrakce, transformace a vložení dat (1) - proces ETL a jeho součásti, nástroje pro proces ETL, extrakce dat: výběr zdrojů dat, mapování, metody extrakce dat.
  6. Proces extrakce, transformace a vložení dat (2) - transformace dat: anomálie v datech, problémy transformace a jejich řešení, nástroje a techniky, zajištění kvality dat.
  7. Proces extrakce, transformace a vložení dat (3) - vložení dat: techniky pro přenos dat, definice procesu vložení, techniky vkládání dat, post-processing.
  8. SQL konstrukce pro datové sklady - agregační operace v datových skladech, analytické dotazy v SQL, využití regulárních výrazů v SQL.
  9. Prostředí Oracle Warehouse Builder (1) - popis nástroje a definice jednotlivých kroků celého ETL procesu.
  10. Prostředí Oracle Warehouse Builder (2) - přístup k různým datovým zdrojům, správa metadat, řízení bezpečnosti.
  11. Výkonnost datového skladu - výkonnost procesu ETL, ladění výkonnosti, nastavení parametrů, využití materializovaných pohledů.
  12. Optimalizace v datových skladech - optimalizace na různých úrovních, optimalizace analytických dotazů.
  13. Podpora pro datové sklady v SŘBD Oracle - seznámení s různými nástroji firmy Oracle pro práci s datovými sklady.

Osnova počítačových cvičení:
Cvičení 1x za 14 dní v rozsahu 2 vyučovací hodiny.
1. Úvodní cvičení: seznámení s laboratoří a nástroji Oracle využívanými na cvičeních, organizační pokyny, úvod do návrhu datového skladu.
2. Prostředí Oracle Warehouse Builder - instalace a konfigurace, vytvoření projektu a definice zdrojů dat různých typů.
3. Definice procesu extrakce, transformace a vložení dat v prostředí Oracle Warehouse Builder - mapování zdrojových a cílových dat, jednotlivé ETL operace.
4. Nasazení a ladění projektu pro vytvoření datového skladu, úvod do administrace datového skladu.
5. Analytické SQL konstrukce, práce s multidimenzionálním modelem dat a OLAP analýza dat obsažených v datovém skladu.
6. Praktický příklad zahrnující celý proces vytvoření datového skladu v prostředí nástroje Oracle Warehouse Builder.
Osnova ostatní - projekty, práce:
Projekt bude zahrnovat návrh a vytvoření datového skladu ze zadaného vzorku dat OLTP databáze v nástroji Oracle Warehouse Builder, včetně návrhu procesu extrakce, transformace a vložení dat a jejich analýzy.

Učební cíle

Porozumět principům tvorby a použití datových skladů v prostředí Oracle 11g. Seznámit se s nástroji a procesy tvorby datového skladu. Porozumět procesu extrakce, transformace a vložení dat z OLTP systémů do datového skladu. Seznámit se s konstrukcemi jazyka SQL pro datové sklady a s využitím Oracle Warehouse Builderu pro tvorbu datového skladu.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

  • Samostatný projekt na vytvoření datového skladu v prostředí Oracle 11g.
  • Písemný test na závěr semestru.

Základní literatura

  • Griesemer, B.: Oracle Warehouse Builder 11g: Getting Started. Packt Publishing, 2009.
  • Dokumentace k produktu Oracle Warehouse Builder 11g.

Zařazení předmětu ve studijních plánech

  • Program IT-BC-3 bakalářský

    obor BIT , libovolný ročník, letní semestr, volitelný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Koncepce datových skladů v prostředí Oracle 11g - základní pojmy: datový sklad, ETL, OLTP a OLAP databáze, přístupy k vytváření datových skladů, fakta a dimenze.
  2. Logický a fyzický model datového skladu (1) - problematika modelování dat v datových skladech, pojmy obchodní, logický a fyzický model.
  3. Logický a fyzický model datového skladu (2) - fyzické modely datového skladu (schéma hvězdy, sněhové vločky), charakteristiky tabulek faktů a dimenzí, transformace mezi jednotlivými modely.
  4. Struktury pro efektivní tvorbu datových skladů - nastavení velikosti datového skladu, dělení dat, indexování, optimalizace, paralelizace, bezpečnost dat.
  5. Proces extrakce, transformace a vložení dat (1) - proces ETL a jeho součásti, nástroje pro proces ETL, extrakce dat: výběr zdrojů dat, mapování, metody extrakce dat.
  6. Proces extrakce, transformace a vložení dat (2) - transformace dat: anomálie v datech, problémy transformace a jejich řešení, nástroje a techniky, zajištění kvality dat.
  7. Proces extrakce, transformace a vložení dat (3) - vložení dat: techniky pro přenos dat, definice procesu vložení, techniky vkládání dat, post-processing.
  8. SQL konstrukce pro datové sklady - agregační operace v datových skladech, analytické dotazy v SQL, využití regulárních výrazů v SQL.
  9. Prostředí Oracle Warehouse Builder (1) - popis nástroje a definice jednotlivých kroků celého ETL procesu.
  10. Prostředí Oracle Warehouse Builder (2) - přístup k různým datovým zdrojům, správa metadat, řízení bezpečnosti.
  11. Výkonnost datového skladu - výkonnost procesu ETL, ladění výkonnosti, nastavení parametrů, využití materializovaných pohledů.
  12. Optimalizace v datových skladech - optimalizace na různých úrovních, optimalizace analytických dotazů.
  13. Podpora pro datové sklady v SŘBD Oracle - seznámení s různými nástroji firmy Oracle pro práci s datovými sklady.

Cvičení na počítači

12 hod., nepovinná

Vyučující / Lektor

Osnova

Cvičení 1x za 14 dní v rozsahu 2 vyučovací hodiny.
1. Úvodní cvičení: seznámení s laboratoří a nástroji Oracle využívanými na cvičeních, organizační pokyny, úvod do návrhu datového skladu.
2. Prostředí Oracle Warehouse Builder - instalace a konfigurace, vytvoření projektu a definice zdrojů dat různých typů.
3. Definice procesu extrakce, transformace a vložení dat v prostředí Oracle Warehouse Builder - mapování zdrojových a cílových dat, jednotlivé ETL operace.
4. Nasazení a ladění projektu pro vytvoření datového skladu, úvod do administrace datového skladu.
5. Analytické SQL konstrukce, práce s multidimenzionálním modelem dat a OLAP analýza dat obsažených v datovém skladu.
6. Praktický příklad zahrnující celý proces vytvoření datového skladu v prostředí nástroje Oracle Warehouse Builder.

Projekt

14 hod., nepovinná

Vyučující / Lektor