Publication detail

Závěrečná zpráva projektu GAČR 102/00/1084: RTD technologie hláskové separace zamaskované v šumu

Original Title

Závěrečná zpráva projektu GAČR 102/00/1084: RTD technologie hláskové separace zamaskované v šumu

Czech Title

Závěrečná zpráva projektu GAČR 102/00/1084: RTD technologie hláskové separace zamaskované v šumu

Language

cs

Original Abstract

Byla navržena a ověřena modifikovaná jednokanálová metoda spektrálního odečítání s uvažováním fyziologických vlastností lidského sluchu. Bylo zjištěno, že navržený přístup umožňuje na základě modifikace rozdílových parametrů nalézt kompromis mezi mírou potlačení šumu, zkreslením řeči a zejména hladinou tzv. hudebního šumu, který je produktem metody spektrálního odečítání. Dále byla vyvinuta statistická metoda prahování s využitím waveletovy transformace. Řečový signál je svou povahou nestacionární s kvazistacionárními úseky. Ke změnám fonémů přitom dochází v podstatě skokově. Fourierova transformace ve své obvyklé podobě není schopna postihnout vývoj signálu v čase. Krátkodobá Fourierova analýza poskytuje lepší výsledky, ale pevná délka okna nesleduje proměnnou délku fonému a ani různé tempo řeči. Tyto nevýhody řeší waveletová transformace. Je vhodné ji použít jak pro detekci základního tónu, tak i pro potlačení šumu.

Czech abstract

Byla navržena a ověřena modifikovaná jednokanálová metoda spektrálního odečítání s uvažováním fyziologických vlastností lidského sluchu. Bylo zjištěno, že navržený přístup umožňuje na základě modifikace rozdílových parametrů nalézt kompromis mezi mírou potlačení šumu, zkreslením řeči a zejména hladinou tzv. hudebního šumu, který je produktem metody spektrálního odečítání. Dále byla vyvinuta statistická metoda prahování s využitím waveletovy transformace. Řečový signál je svou povahou nestacionární s kvazistacionárními úseky. Ke změnám fonémů přitom dochází v podstatě skokově. Fourierova transformace ve své obvyklé podobě není schopna postihnout vývoj signálu v čase. Krátkodobá Fourierova analýza poskytuje lepší výsledky, ale pevná délka okna nesleduje proměnnou délku fonému a ani různé tempo řeči. Tyto nevýhody řeší waveletová transformace. Je vhodné ji použít jak pro detekci základního tónu, tak i pro potlačení šumu.

BibTex


@techreport{BUT65117,
  author="Zdeněk {Smékal}",
  title="Závěrečná zpráva projektu GAČR 102/00/1084: RTD technologie hláskové separace zamaskované v šumu",
  annote="Byla navržena a ověřena modifikovaná jednokanálová metoda spektrálního odečítání s uvažováním fyziologických vlastností lidského sluchu. Bylo zjištěno, že navržený přístup umožňuje na základě modifikace rozdílových parametrů nalézt kompromis mezi mírou potlačení šumu, zkreslením řeči a zejména hladinou tzv. hudebního šumu, který je produktem metody spektrálního odečítání. Dále byla vyvinuta statistická metoda prahování s využitím waveletovy transformace. Řečový signál je svou povahou nestacionární s kvazistacionárními úseky. Ke změnám fonémů přitom dochází v podstatě skokově. Fourierova transformace ve své obvyklé podobě není schopna postihnout vývoj signálu v čase. Krátkodobá Fourierova analýza poskytuje lepší výsledky, ale pevná délka okna nesleduje proměnnou délku fonému a ani různé tempo řeči. Tyto nevýhody řeší waveletová transformace. Je vhodné ji použít jak pro detekci základního tónu, tak i pro potlačení šumu.",
  chapter="65117",
  year="2002",
  month="december",
  type="report"
}