Detail předmětu
Zpracování řečových signálů
FIT-ZREAk. rok: 2019/2020
Aplikace počítačového zpracování řeči, číslicové zpracování řečových signálů, tvorba a slyšení řeči, úvod do fonetiky, předzpracování a základní parametry, lineárně-prediktivní model, cepstrum, určování základního tónu hlasu, kódování - časová oblast a vokodéry, rozpoznávání - DTW a HMM, syntéza. Software a knihovny pro zpracování řeči.
Garant předmětu
Zajišťuje ústav
Výsledky učení předmětu
Studenti se seznámí se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Pochopí základní algoritmy analýzy řeči společné mnohým aplikacím. Získají přehled o aplikacích (rozpoznávání, syntéza, kódování) a o praktických stránkách implementace řečových algoritmů. Budou schopni navrhnout jednoduchý systém pro zpracování řeči (detektor řečové aktivity, rozpoznávač několika izolovaných slov), včetně implementace do aplikačních programů.
Doporučená nebo povinná literatura
Gold, B., Morgan, N.: Speech and Audio Signal Processing, Wiley-Interscience; 2 edition.
Rabiner, L. R., & Schafer, R. W. Theory and applications of digital speech processing, Pearson, 2011.
Psutka, J., Müller, L., Matoušek, J., & Radová, V., Mluvíme s počítačem česky, Academia, 2006.
Yu, D., Deng, L., Automatic speech recognition, Springer, 2016.
Způsob a kritéria hodnocení
- půlsemestrální test 14b
- projekt 29b
- presentace výsledků na poč. cvičeních 6b
Jazyk výuky
čeština, angličtina
Cíl
Seznámit studenty se základními charakteristikami řečového signálu v návaznosti na tvorbu a slyšení řeči lidmi. Popsat základní algoritmy analýzy řeči společné mnohým aplikacím. Podat přehled aplikací (rozpoznávání, syntéza, kódování) a informovat o praktických stránkách implementace řečových algoritmů.
Zařazení předmětu ve studijních plánech
- Program IT-MGR-2 magisterský navazující
obor MBS , libovolný ročník, letní semestr, 5 kreditů, volitelný
obor MBI , libovolný ročník, letní semestr, 5 kreditů, povinně volitelný
obor MIS , libovolný ročník, letní semestr, 5 kreditů, volitelný
obor MIN , libovolný ročník, letní semestr, 5 kreditů, povinně volitelný
obor MMM , libovolný ročník, letní semestr, 5 kreditů, volitelný
obor MPV , libovolný ročník, letní semestr, 5 kreditů, povinně volitelný - Program MITAI magisterský navazující
specializace NBIO , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NISD , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NISY , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NIDE , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NCPS , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NSEC , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NMAT , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NGRI , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NNET , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NVIZ , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NSEN , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NMAL , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NHPC , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NVER , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NEMB , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NADE , libovolný ročník, letní semestr, 5 kreditů, volitelný
specializace NSPE , libovolný ročník, letní semestr, 5 kreditů, povinný - Program IT-MGR-2 magisterský navazující
obor MGM , 1. ročník, letní semestr, 5 kreditů, povinný
obor MSK , 2. ročník, letní semestr, 5 kreditů, povinně volitelný
Typ (způsob) výuky
Přednáška
26 hod., nepovinná
Vyučující / Lektor
Osnova
- Úvod, aplikace zpracování řeči.
- Číslicové zpracování řečových signálů.
- Tvorba a řeči a její signálový model.
- Předzpracování a základní parametry, cepstrum.
- Lineárně-prediktivní model.
- Určování základního tónu hlasu
- Kódování řeči - základy.
- Kódování řeči CELP.
- Základy rozpoznávání řeči, DTW.
- Skryté Markovovy modely HMM.
- Systémy pro rozpoznávání řeči s velkým slovníkem (LVCSR).
- Rozpoznávání mluvčího a jazyka. Využití neuronových sítí ve zpracování řeči.
- Syntéza řeči z textu.
Cvičení odborného základu
2 hod., povinná
Vyučující / Lektor
Osnova
- Paramatrizace, DTW, HMM.
Cvičení na počítači
12 hod., povinná
Vyučující / Lektor
Osnova
- V laboratořích (kromě poslední) je používán Matlab.
- Úvod.
- Lineární predikce a vektorové kvantování.
- Určování základního tónu a kódování řeči.
- Základy klasifikace.
- Rozpoznávání - Dynamic time Warping (DTW).
- Rozpoznávání - skryté Markovovy modely (HTK).