dizertační práce

Rozpoznání emočního stavu z hrané a spontánní řeči

Text práce 2.92 MB Teze 887.64 kB

Autor práce: Ing. Hicham Atassi, Ph.D.

Ak. rok: 2014/2015

Vedoucí: prof. Ing. Zdeněk Smékal, CSc.

Oponenti: Dr. Ing. Jiří Přibil, prof. Ing. Pavel Zahradník, CSc.

Abstrakt:

Dizertační práce se zabývá rozpoznáním emočního stavu mluvčích z řečového signálu. Práce je rozdělena do dvou hlavních častí, první část popisuju navržené metody pro rozpoznání emočního stavu z hraných databází. V rámci této části jsou představeny výsledky rozpoznání použitím dvou různých databází s různými jazyky. Hlavními přínosy této části je detailní analýza rozsáhlé škály různých příznaků získaných z řečového signálu, návrh nových klasifikačních architektur jako je například „emoční párování“ a návrh nové metody pro mapování diskrétních emočních stavů do dvou dimenzionálního prostoru. Druhá část se zabývá rozpoznáním emočních stavů z databáze spontánní řeči, která byla získána ze záznamů hovorů z reálných call center. Poznatky z analýzy a návrhu metod rozpoznání z hrané řeči byly využity pro návrh nového systému pro rozpoznání sedmi spontánních emočních stavů. Jádrem navrženého přístupu je komplexní klasifikační architektura založena na fúzi různých systémů. Práce se dále zabývá vlivem emočního stavu mluvčího na úspěšnosti rozpoznání pohlaví a návrhem systému pro automatickou detekci úspěšných hovorů v call centrech na základě analýzy parametrů dialogu mezi účastníky telefonních hovorů.

Klíčová slova:

Rozpoznání emocí, řečový signál, klasifikace, spektrální příznaky, příznaky kvality řeči, spontánní řeč, analýza dialogu, call centru, komplexní klasifikační struktury, fúze

Termín obhajoby

11.11.2014

Výsledek obhajoby

obhájeno (práce byla úspěšně obhájena)

znakmkaPznamka

Jazyk práce

angličtina

Fakulta

Ústav

Studijní obor

Teleinformatika (PK-TLI)

Složení komise

prof. Ing. Jiří Mišurec, CSc. (předseda)
doc. Ing. Anna Přibilová, Ph.D. (člen)
doc. Ing. Otto Dostál, CSc. (člen)
Dr. Ing. Jiří Přibil - oponent (člen)
prof. Ing Pavel Zahradník, CSc. - oponent (člen)
doc. Ing. Radim Burget, Ph.D. (člen)
doc. Ing. Petr Sysel, Ph.D. (člen)

Ing. Hicham Atassi zahájil své doktorské studium v roce 2007. Zpočátku se věnoval obecně metodám číslicového zpracování signálů a až postupně se jeho úsilí soustředilo na analýzu emocí z řečového signálu. Absolvoval několik zahraničních stáží, delší dobu působil jako vědec i pedagog na univerzitě ve Stirlingu (UK). Splnil podmínky jak pedagogické praxe, tak i počtu absolvovaných doktorských předmětů. Pracoval na řadě vědeckých projektů, zvláště z řešení projektu MPO s firmou Rétia byl získán patent na vícejazyčný analyzátor emocí věku a pohlaví z řečových záznamů. Jeho publikační činnost je velmi dobrá a určitě by byla i výraznější, kdyby nebyla omezena firemním tajemstvím, které spolupracující firma požadovala dodržet. Byl a je pravidelně zván na významné světové konference k přednesení zvaných přednášek. Vřele doporučuji přijetí jeho disertační práce k obhajobě.

Posudek oponenta
Dr. Ing. Jiří Přibil

viz posudek ve formátu pdf
Soubor vložený oponentem Velikost
Posudek oponenta [.pdf] 129.32 kB

viz posudek ve formátu pdf
Soubor vložený oponentem Velikost
Posudek oponenta [.pdf] 1.22 MB