Publication detail

Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc.

SYSEL, P.

Original Title

Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc.

English Title

One-channel speech enhancement method based on wavelet transform in spectral domain

Type

dissertation

Language

Czech

Original Abstract

Disertační práce je zaměřena na metody zvýraznění řečového signálu ze šumu. V první části je uveden přehled metod používaných v současné době a základy časově-kmitočtových metod analýzy signálů, především krátkodobá Fourierova transformace a waveletová transformace. V další části je uveden rozbor metod pro odhad výkonové spektrální hustoty šumu a rušení (periodogram, Bartlettova metoda, AR modely) a vlastností pro jejich vzájemné porovnání (vychýlení odhadu, rozptyl odhadu). Na základě tohoto rozboru je navržena metoda pro odhad výkonové spektrální hustoty pomocí prahování koeficientů waveletové transformace periodogramu, která vykazuje menší rozptyl odhadu než ostatní metody. V závěru práce je provedeno zvýraznění řečových signálů zarušených v reálných prostředích metodou spektrálního odečítání s různými metodami odhadu výkonové spektrální hustoty a je provedeno vyhodnocení výsledků. Navržená metoda je vhodná především pro rušení, které má výrazně náhodný charakter jako je tekoucí voda, hluk mixéru, vysavače, apod.

English abstract

This doctoral thesis deals with methods of enhancing speech embedded in noise. In the first part the speech enhancement methods, which are currently used, are summarized and methods of time-frequency analysis are introduced, namely the short time Fourier transform and the wavelet transform. In the next part, methods of power spectral density estimation (periodogram, Bartlett method, AR models) are discussed and their characteristics are examined and compared (estimation bias, estimation variance). Based on this study a new method of power spectral density estimation via thresholding the wavelet coefficients of the periodogram is proposed that exhibits a smaller estimation variance than the other methods. Finally the enhancement of noisy speech records from an actual environment by spectral subtraction using various methods of power spectral density estimation is realized and the result is evaluated. The proposed method is suitable for noise that has a markedly random character such as shower, mixer noise, vacuum-cleaner noise, etc.

Keywords

waveletová transformace, kvadraturní zrcadlové filtry, výkonová spektrální hustota, spektrální odečítání, zvýraznění řeči

Key words in English

wavelet transform, quadrature mirror filters, power spectral density, spectral subtraction, speech enhancement

Authors

SYSEL, P.

Released

7. 9. 2007

Publisher

VUT v Brně

Location

Brno

Pages from

1

Pages to

108

Pages count

108

BibTex

@phdthesis{BUT66828,
  author="Petr {Sysel}",
  title="Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc.",
  publisher="VUT v Brně",
  address="Brno",
  pages="1--108",
  year="2007"
}