Detail předmětu

Získávání znalostí z databází

ÚSI-2ICZDAk. rok: 2018/2019

Základní pojmy související se získáváním znalostí z databází, vztah získávání znalostí a dolování dat. Zdroje dat pro získávání znalostí. Podstata a techniky předzpracování dat pro dolování. Systémy pro získávání znalostí, dotazovací jazyky pro dolování. Techniky dolování různých typů znalostí - asociační pravidla, klasifikace a predikce, shlukování. Dolování v netradičních datech - proudech dat, časových řadách a posloupnostech, grafech, prostorových a časoprostorových datech, multimediálních datech. Dolování v textu a na webu. Vypracování projektu využitím dostupného nástroje pro dolování v datech.

Výsledky učení předmětu

Studenti získají dostatečně široký a přitom i dostatečně do hloubky jdoucí přehled v oblasti získávání znalostí z databází.
Jsou schopni nástroje pro získávání znalostí používat i vytvářet.
Student se naučí odborné terminologii v českém i anglickém jazyce.
Student získá zkušenost s řešením projektů v malém týmu.
Student se zdokonalí v prezentaci a obhajobě výsledků projektu.

Prerekvizity

Nejsou požadovány

Doporučená nebo povinná literatura

Han, J., Kamber, M.: Data Mining: Concepts and Techniques. Second Edition. Elsevier Inc., 2006, 770 p., ISBN 1-55860-901-3.
Berka, P.: Dobývání znalostí za databází. Academia, 2003, 366 s., ISBN 80-200-1062-9.
Dunham, M.H.: Data Mining. Introductory and Advanced Topics. Pearson Education, Inc., 2003, 315 p.
Zendulka, J. a kol.: Získávání znalostí z databází. FIT VUT v Brně, 160 s., 2009.
Zendulka, J., Kunc, M., Stryka, L.: Získávání znalostí z databází. FIT. Extrakce informací a získávání znalostí na Webu. FIT VUT v Brně, 65 s., 2010.

Plánované vzdělávací činnosti a výukové metody

Výuka se realizuje formou přednášek, které mají charakter výkladu základních principů, metodologie dané disciplíny, problémů a jejich vzorových řešení.

Způsob a kritéria hodnocení

Půlsemestrální písemná zkouška, formulace dolovací úlohy, obhajoba projektu. Udělení zápočtu je podmíněno vypracováním projektu a ziskem minimálně 24 bodů za bodované aktivity v průběhu semestru.

Jazyk výuky

čeština

Osnovy výuky

1. Úvod - motivace, základní pojmy, typy zdrojů dat a získávaných znalostí, metodologie.
2. Datové sklady a technologie OLAP pro získávání znalostí z databází.
3. Předzpracování dat v procesu získávání znalostí - metody předzpracování.
4. Předzpracování dat v procesu získávání znalostí - charakteristiky dat.
5. Dolování frekventovaných vzorů a asociací - základní pojmy, efektivní a škálovatelné metody hledání frekventovaných množin.
6. Víceúrovňová asociační pravidla, asociační a korelační analýza, omezená asociační pravidla.
7. Klasifikace a predikce - základní pojmy, rozhodovací strom, bayesovská klasifikace, klasifikace založená na pravidlech.
8. Klasifikace s využitím neuronových sítí, SVM klasifikátor, další metody klasifikace, predikce.
9. Shluková analýza - základní pojmy, typy dat při shlukování, metody založené na rozčleňování, hierarchické metody. Další metody shlukování.
10. Úvod do dolování v proudech dat, časových řadách a posloupnostech.
11. Úvod do dolování v grafech, časoprostorových datech a datech pohybujících se objektů.
12. Dolování v biologických datech.
13. Dolování textu a na webu.

Cíl

Seznámit studenty s problematikou získávání znalostí z různých typů datových zdrojů, vysvětlit typy užitečných znalostí a jednotlivé kroky procesu získávání znalostí z dat a seznámit je s technikami, algoritmy a nástroji používanými při tomto procesu.

Vymezení kontrolované výuky a způsob jejího provádění a formy nahrazování zameškané výuky

Není specifikováno.

Zařazení předmětu ve studijních plánech

  • Program MRzI magisterský navazující

    obor RIS , 2. ročník, zimní semestr, 5 kreditů, povinný

Typ (způsob) výuky

 

Přednáška

39 hod., nepovinná

Vyučující / Lektor