Detail předmětu

Ukládání a příprava dat

FIT-UPAAk. rok: 2019/2020

Předmět zavádí základní klasifikaci dat z pohledu získávání znalostí z dat a přibližuje v širší úrovni vybrané moderní databázové systémy s tím, že vybrané partie studuje i do hloubky --- jedná se o objektově-relační databáze, prostorové databáze včetně problematiky ukládání a indexace vícerozměrných dat, NoSQL databáze, XML a multimediální databáze, pokročilé možnosti dotazování nad relačními databázemi. Dále je vysvětlen proces získávání znalostí z dat a jeho jednotlivé kroky se zaměřením zejména na typické úlohy předzpracování dat před samotnou extrakcí potenciálně užitečných znalostí z dat. Proces získávání znalostí je ilustrován na případových studiích.

Výsledky učení předmětu

Studenti budou schopni klasifikovat data z pohledu získávání znalostí, ukládat a manipulovat data ve vhodných databázových systémech, rychle vyhledávat potřebné údaje, zkoumat vlastnosti dat a připravit je pro následnou extrakci znalostí.
- Student lépe zvládne práci s daty v různých situacích
- Student se zdokonalí v řešení malých projektů v malém týmu

Prerekvizity

Základy teorie relačního modelu dat. Formalizace návrhu relační databáze. Organizace dat na interní úrovni. Bezpečnost a integrita dat. Transakce. Konceptuální modelování a návrh relační databáze z konceptuálního modelu. Jazyk SQL. Základy počítačové grafiky. Základy výpočetní geometrie. Objektové paradigma. Základy statistiky a pravděpodobnosti.

Doporučená nebo povinná literatura

Podklady k přednáškám (slajdy, skripty, apod.)
Lemahieu, W., Broucke, S., Baesens, B.: Principles of Database Management. Cambridge University Press. 2018, 780 p.
Kim, W. (ed.): Modern Database Systems, ACM Press, 1995, ISBN 0-201-59098-0
Melton, J.: Advanced SQL: 1999 - Understanding Object-Relational and Other Advanced. Morgan Kaufmann, 2002, p. 562, ISBN 1-558-60677-7
Shekhar, S., Chawla, S.: Spatial Databases: A Tour, Prentice Hall, 2002/2003, p. 262, ISBN 0-13-017480-7
Dunckley, L.: Multimedia Databases: An Object-Relational Approach. Pearson Education, 2003, p. 464, ISBN 0-201-78899-3
Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Third Edition. Morgan Kaufmann Publishers, 2012, p. 703, ISBN 978-0-12-381479-1
Gaede, V., Günther, O.: Multidimensional Access Methods, ACM Computing Surveys, Vol. 30, No. 2, 1998, pp. 170-231.

Způsob a kritéria hodnocení

  • Půlsemestrální zkouška, u které neexistuje náhradní, či opravný termín.
  • Řešení 1 projektu v průběhu semestru a jeho odevzdání ve stanoveném termínu.

Podmínky zápočtu:
Student musí během semestru získat alespoň 50% bodů z možného maxima, tj. 20 bodů ze 40.
Pokud bude odhaleno plagiátorství nebo nedovolená spolupráce na projektech, či u půlsemestrální zkoušky, zápočet nebude udělen a dále bude zváženo zahájení disciplinárního řízení.

Jazyk výuky

čeština

Cíl

Vysvětlit základní klasifikaci dat a datových zdrojů, podat hlubší pohled na vybrané databázové systémy (objektově-relační, prostorové, NoSQL, XML a multimediální), včetně principů efektivních přístupových metod k datům, dále vysvětlit podstatu a jednotlivé kroky procesu získávání znalostí z dat se zaměřením na předzpracování dat a explorační analýzu.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

  • Půlsemestrální zkouška - písemně, formou otázek, kde odpovědi se tvoří celou větou, neexistuje náhradní/opravný termín. (20 bodů)
  • Vypracování projektů - 1 projekt (vytvoření programu, dle zadání) s příslušnou dokumentací. (20 bodů)
  • Závěrečná zkouška se skládá z otázek, kde odpovědi se tvoří celou větou. Maximální hodnocení zkoušky je 60 bodů, přičemž pro získání bodů ze zkoušky je nutné zkoušku vypracovat tak, aby byla hodnocena nejméně 25 body, v opačném případě bude zkouška hodnocena 0 body. Zkouška má jeden řádný a dva opravné termíny. Řádný termín zkoušky bude realizován písemnou formou, opravné termíny budou realizovány formou písemnou nebo kombinovanou (tedy písemně i ústně v jeden den - ráno písemná, odpoledne ústní část). Forma opravných termínů zkoušky bude oznámena vždy po vyhodnocení předchozího termínu zkoušky, přičemž kombinovaná forma zkoušky může být zvolena tehdy, pokud se daného termínu zkoušky bude moci zúčastnit nejvýše 16 studentů.

Zařazení předmětu ve studijních plánech

  • Program MITAI magisterský navazující

    specializace NISY , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NSEC , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NMAT , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NGRI , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NHPC , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NVER , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NEMB , libovolný ročník, zimní semestr, 5 kreditů, povinný
    specializace NBIO , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NISD , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NIDE , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NCPS , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NNET , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NVIZ , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NSEN , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NMAL , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NADE , 1. ročník, zimní semestr, 5 kreditů, povinný
    specializace NSPE , 1. ročník, zimní semestr, 5 kreditů, povinný

Typ (způsob) výuky

 

Přednáška

26 hod., nepovinná

Vyučující / Lektor

Osnova

  1. Úvod: obsah předmětu, charakter dat, úvod k získávání znalostí z dat, rekapitulace historického vývoje databázových technologií
  2. Objektově relační DB, objektově-relační mapování, pokročilé vlastnosti SQL
  3. Prostorové DB: problematika uložení a zpracování
  4. Prostorové DB: způsoby řešení ukládání
  5. Indexace v prostorových DB I - bodové útvary
  6. Indexace v prostorových DB II - vícerozměrné útvary
  7. Půlsemestrální zkouška
  8. Multimediální a XML databáze
  9. NoSQL databáze
  10. Proces získávání znalostí z dat, předzpracování dat v procesu získávání znalostí - charakteristiky dat, exploratorní analýza.
  11. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
  12. Základní úlohy získávání znalostí z dat a příklady odpovídajících metod
  13. Programovací jazyky používané pro získávání znalostí z dat a ukázkové případové studie získávání znalostí z dat

Cvičení odborného základu

6 hod., povinná

Vyučující / Lektor

Osnova

DEMO cvičení

  1. Objektově-relační a prostorové databáze, práce v nich, zvláštnosti užití
  2. Multimediální a XML databáze, indexace dat
  3. NoSQL databáze

Cvičení na počítači

6 hod., povinná

Vyučující / Lektor

Osnova

  1. Aplikační vazby na objektově relační databáze, aplikace v prostorových databázích
  2. Multimediální a XML databáze, indexace dat
  3. NoSQL databáze v aplikacích

Projekt

14 hod., povinná

Vyučující / Lektor

Osnova

  1. Vytvoření aplikace a demonstrace vlastností práce s nestrukturovanými i strukturovanými daty různé povahy.

eLearning