Detail publikace

Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc.

SYSEL, P.

Originální název

Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc.

Anglický název

One-channel speech enhancement method based on wavelet transform in spectral domain

Typ

dizertace

Jazyk

čeština

Originální abstrakt

Disertační práce je zaměřena na metody zvýraznění řečového signálu ze šumu. V první části je uveden přehled metod používaných v současné době a základy časově-kmitočtových metod analýzy signálů, především krátkodobá Fourierova transformace a waveletová transformace. V další části je uveden rozbor metod pro odhad výkonové spektrální hustoty šumu a rušení (periodogram, Bartlettova metoda, AR modely) a vlastností pro jejich vzájemné porovnání (vychýlení odhadu, rozptyl odhadu). Na základě tohoto rozboru je navržena metoda pro odhad výkonové spektrální hustoty pomocí prahování koeficientů waveletové transformace periodogramu, která vykazuje menší rozptyl odhadu než ostatní metody. V závěru práce je provedeno zvýraznění řečových signálů zarušených v reálných prostředích metodou spektrálního odečítání s různými metodami odhadu výkonové spektrální hustoty a je provedeno vyhodnocení výsledků. Navržená metoda je vhodná především pro rušení, které má výrazně náhodný charakter jako je tekoucí voda, hluk mixéru, vysavače, apod.

Anglický abstrakt

This doctoral thesis deals with methods of enhancing speech embedded in noise. In the first part the speech enhancement methods, which are currently used, are summarized and methods of time-frequency analysis are introduced, namely the short time Fourier transform and the wavelet transform. In the next part, methods of power spectral density estimation (periodogram, Bartlett method, AR models) are discussed and their characteristics are examined and compared (estimation bias, estimation variance). Based on this study a new method of power spectral density estimation via thresholding the wavelet coefficients of the periodogram is proposed that exhibits a smaller estimation variance than the other methods. Finally the enhancement of noisy speech records from an actual environment by spectral subtraction using various methods of power spectral density estimation is realized and the result is evaluated. The proposed method is suitable for noise that has a markedly random character such as shower, mixer noise, vacuum-cleaner noise, etc.

Klíčová slova

waveletová transformace, kvadraturní zrcadlové filtry, výkonová spektrální hustota, spektrální odečítání, zvýraznění řeči

Klíčová slova v angličtině

wavelet transform, quadrature mirror filters, power spectral density, spectral subtraction, speech enhancement

Autoři

SYSEL, P.

Vydáno

7. 9. 2007

Nakladatel

VUT v Brně

Místo

Brno

Strany od

1

Strany do

108

Strany počet

108

BibTex

@phdthesis{BUT66828,
  author="Petr {Sysel}",
  title="Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc.",
  publisher="VUT v Brně",
  address="Brno",
  pages="1--108",
  year="2007"
}