Detail předmětu
Konvoluční neuronové sítě
FIT-KNNAk. rok: 2020/2021
Řešení založená na metodách strojového učení postupně nahrazují ručně navržená řešení v mnoha oblastech vývoje software, speciálně pak v percepčních úlohách zaměřených na získávání informací o reálném světě z informačně bohatých senzorů jako jsou kamery, mikrofony a podobně. Dominantní metodou strojového učení jsou v současné době neuronové sítě, a speciálně pak jejich varianty zaměřené na strukturovaná data - konvoluční neuronové sítě. Tyto přístupy jsou jádrem mnoha úspěšných komerčních aplikací a posunují možnosti umělé inteligence.
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
Studenti se seznámí se základy konvolučních neuronových sítí, jejich učení (optimalizace), jejich stavebními bloky a programovými prostředími (frameworky) pro jejich implementaci. Získají základní povědomí o faktorech, které určují jejich úspěšnost v reálných aplikacích včetně vlastností datové sady, vhodnosti chybové funkce, vhodné struktury sítě, regularizace, optimalizace, přetrénování sítí a multi-task učení. Studenti se také seznámí s konkrétními příklady neuronových sítí pro široké spektrum úloh počítačového vidění (klasifikace, detekce, segmentace, identifikace), zpracování řeči, jazykového modelování, posilovaného učení a generování dat.
Studenti si vyzkouší spolupráci na týmovém projektu a seznámí se s knihovnami jazyka Python zaměřenými na matematické operace, lineární algebru a strojové učení.
Prerekvizity
Základní znalosti lineární algebry (násobení vektorů a matic), diferenciálního počtu (parciální derivace a její význam, řetězcové pravidlo), jazyka Python a intuitivní pochopení teorie pravděpodobnosti (např. podmíněná pravděpodobnost). Jakékoliv znalosti strojového učení a zpracování obrazu jsou výhodou.
Doporučená nebo povinná literatura
Goodfellow, I., Bengio, Y., Courville, A.: Deep Learning. MIT Press, 2016.
Li, Fei-Fei, et al.: CS231n: Convolutional Neural Networks for Visual Recognition. Stanford, 2018.
Bishop, C. M.: Pattern Recognition, Springer Science + Business Media, LLC, 2006, ISBN 0-387-31073-8.
Způsob a kritéria hodnocení
- Hodnocený projekt s obhajobou - 65 bodů.
- Dva testy během semestru - 35 bodů.
Podmínky zápočtu:
Získání alespoň 50 bodů z hodnocených částí předmětu.
Jazyk výuky
čeština
Cíl
Seznámit se s konovlučními neuronovými sítěmi, jejich možnostmi, limity a s jejich praktickým využitím převážně v úlohách zpracování obrazu a počítačového vidění s částečným přesahem do zpracování řeči a jazyka. Umožnit absolventům samostatně používat konvoluční sítě v praktických aplikacích a celkově navrhovat řešení založená na konvolučních sítích včetně struktury sítí, jejich učení, tvorby datových sad a vyhodnocení kvality výsledku.
Zařazení předmětu ve studijních plánech
- Program MITAI magisterský navazující
specializace NBIO , libovolný ročník, letní semestr, 5 kreditů, povinný
specializace NISD , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NISY , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NIDE , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NCPS , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NSEC , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NMAT , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NGRI , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NNET , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NVIZ , libovolný ročník, letní semestr, 5 kreditů, povinný
specializace NSEN , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NMAL , libovolný ročník, letní semestr, 5 kreditů, povinný
specializace NHPC , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NVER , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NEMB , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NADE , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NSPE , libovolný ročník, letní semestr, 5 kreditů, povinný
Typ (způsob) výuky
Přednáška
26 hod., nepovinná
Vyučující / Lektor
Osnova
- Uvod, lineární modely, chybová funkce, alg. učení (optimalizace), vyhodnocení.
- Plně propojené sítě, chybové funkce pro klasifikaci a regresi.
- Konvoluční sítě, lokalita a invariance výpočtů.
- Generalizace, regularizace, rozšiřování datových sad, multi-task sítě a předtrénování.
- Problémy při učení. Batch normalizace. Existující architektury klasifikačních sítí pro obraz.
- Detekce objektů: MTCNN face detektor, R-CNN, Fast R-CNN, Faster R-CNN, YOLO, SSD.
- Sémantická segmentace a segmentace instancí. Odhad vzdáleností, normál povrchu, osvětlení a pohybu.
- Sítě pro učení podobností a embedding. Rozpoznávání osob podle obličeje a hlasu.
- Rekurentní neuronové sítě a zpracování sekvencí (textu a řeči). Connectionist Temporal Classification (CTC). Sítě s pozorností.
- Jazykové modely. Základní modely pro generování popisů obrázků, odpovědi na otázky, překlad jazyka a podobně.
- Generativní modely. Autoregresivní faktorizace. Generative Adversarial Networks.
- Posilované učení s neuronovými sítěmi. Deep Q-network (DQN) a policy gradients.
- Přehled nových a neortodoxních aplikací konvolučních sítí a jejich základní myšlenky.
Projekt
26 hod., povinná
Vyučující / Lektor
Osnova
Týmový projekt (2-3 studenti).
Libovolná témata navržená studenty a odsouhlasená vyučujícím.
Postup řešení projektu:
- Formulace úlohy a utvoření týmu.
- Průzkum existujících řešení a použitelných nástrojů.
- Základní řešení a návrh vyhodnocování.
- Sběr dat.
- Experimenty, testování a postupné vylepšení řešení.
- Závěrečná zpráva a prezentace projektu.