Detail projektu
Kvalitativní posun v automatickém rozpoznávání jazyků s využitím streamovaných audio-médií
Období řešení: 19.01.2006 — 19.07.2007
O projektu
Projekt je zaměřen na masivní využití streamovaného audia pro kvalitativní posun v úspěšnosti systémů pro
automatickou identifikaci jazyka (language identification - LID). Skupina zpracování řeči na Fakultě
informačních technologií VUT v Brně (Speech@FIT), jejíž členové projekt podávají, disponuje state-of-the-art
systémem pro LID jazyka založeným na akustickém a fonotaktickém modelování. Pro jeho další zlepšení je
nutné získat velká množství jazykově závislých dat. V rámci projektu budou tato data získávána
z dostupných streamovaných zdrojů (internetová rádia), on-line ukládána, parametrizována a zpracovávána.
Bude vyvíjen software pro paralelní trénování modelů pro LID. Získané modely a algoritmy budou
evaluovány v rámci mezinárodních kampaní NIST a ve spolupráci s českými bezpečnostními složkami.
Popis anglicky
The projects aims at massive usage of streamed audio for a qualitative improvement of LID (automatic
language identification) system accuracy. The speech processing research group at Faculty of Information
Technology, Brno University of Technology (Speech@FIT) disposes of a state-of-the-art LID system based
on acoustic and phonotactic modeling. For further improvement of its accuracy, it is crucial to gather huge
amounts of language-specific data. In the framework of this project, such data will be collected from available
streamed sources (Internet radios), on-line stored, parameterized and processed. We will develop software
for training of LID models. Resulting models and algorithms will be evaluated in international evaluation
campaigns organized by NIST and in cooperation with Czech law enforcement forces.
Klíčová slova
zpracování řeči, identifikace jazyka, paralelní výpočty, získávání řečových dat, streaming
Klíčová slova anglicky
speech processing, language identification, parallel computing, unsupervised acquisition of speech data, streaming
Označení
162/2005
Originální jazyk
čeština
Řešitelé
Černocký Jan, doc. Dr. Ing. - hlavní řešitel
Kašpárek Tomáš, Ing. - spoluřešitel
Matějka Pavel, Ing., Ph.D. - spoluřešitel
Schwarz Petr, Ing., Ph.D. - spoluřešitel
Útvary
Ústav počítačové grafiky a multimédií
- spolupříjemce (19.01.2006 - 19.07.2007)
Výsledky
MATĚJKA, P., BURGET, L., SCHWARZ, P., ČERNOCKÝ, J. NIST 2005 Language Recognition Evaluation. In Proceedings of NIST LRE 2005. Washington DC: 2006. p. 1-37.
Detail