Detail projektu

Zvýrazňování řečového signálu zamaskovaného v šumu

Období řešení: 01.01.2004 — 31.12.2006 Financování: Vnitřní projekty VUT

O projektu

V moderních telekomunikačních systémech je nutné vyřešit základní problém odstranění parazitního rušení z pozadí řečového signálu a zlepšit poměr odstupu signálu od šumu při zachování nebo zlepšení srozumitelnosti výsledné řeči. Cílem projektu je vyvinout původní techniku zvýrazňování řeči zamaskované šumem založenou na nejnovějších poznatcích o řečových signálech, maskovacích vlastnostech lidského ucha a moderních metodách číslicového zpracování signálu včetně matematické statistiky a waveletových transformací. Navržený algoritmus bude optimalizován a upraven pro implementace na signálovém procesoru. Řešení bude navazovat na ukončený projekt GAČR (2000-2002) reg.č. 102/00/1084 s názvem „RTD technologie hláskové separace zamaskované v hluku“. Konečným výsledkem celého projektu bude prototyp zařízení pro použití v reálném digitálním komunikačním systému. Využití technologie je rozsáhlé od využití v mobilních a pevných telekomunikacích (mobilní telefony, modemy typu ISDN nebo ADSL), přes vojenskou komunikační techniku (speciální spojovací systémy), dále v automobilovém průmyslu (handsfree sady v automobilu), přenos hlasu pomocí internetu-VoIP, systémy komunikace s počítačem mluvenou řečí, satelitní přenosy, videokonference a telekonference. Další využití je v řídící a regulační technice, ve spotřební elektronice, v lékařské technice apod..

Popis anglicky
In modern telecommunication systems the basic problem of removing parasitic interference from speech signal background must be solve and the signal-to-noise ration improved while preserving or improving the intelligibility of resultant speech. The project aims at developing an original technique if enhancing speech hidden in noise, base on the latest knowledge of speech signals, masking properties of the human ear and modern methods of digital signal processing, inclusive of mathematical statistics and the wavelet transform. The proposed algorithm will be optimized and modified for implementation on digital signal processors. The solution will follow up on GACR project 102/00/1084 “RTD technology of separating sounds hidden in noise”. The final result of the whole project will be a prototype of a contrivance for use in an actual digital communication system. The application of this technology is vast, ranging from applications in mobile and fixed telecommunications (mobile phones, ISDN aor ADSL modems), through military communication technology (special communication systems), in automotive industry (hands-free sets in cars), voice transmission over the Internet (VoIP), systems for audio communication with computer, satellite transmissions, videoconferences and teleconferences. Further application will be control and regulation technology, consumer electronics and medical hardware.

Klíčová slova
Zvýrazňování řeči zuamaskované šumem, adaptivní algoritmy

Klíčová slova anglicky
Enhancing Speech Hidden in Noise, Adaptive Algorithms

Označení

GA102/04/1097

Originální jazyk

čeština

Řešitelé

Smékal Zdeněk, prof. Ing., CSc.
- hlavní řešitel (25.03.2003 - nezadáno)
Malenovský Vladimír, Ing., Ph.D.
- spoluřešitel (05.11.2003 - nezadáno)
Nagy Zoltán, Ing., Ph.D.
- spoluřešitel (05.11.2003 - nezadáno)
Plšek Martin, Ing.
- spoluřešitel (05.11.2003 - nezadáno)
Rajmic Pavel, doc. Mgr., Ph.D.
- spoluřešitel (05.11.2003 - nezadáno)
Sysel Petr, doc. Ing., Ph.D.
- spoluřešitel (05.11.2003 - nezadáno)
Vích Robert, Ing., DrSc.
- spoluřešitel (05.11.2003 - nezadáno)
Vondra Martin, Ing., Ph.D.
- spoluřešitel (05.11.2003 - nezadáno)

Útvary

Ústav telekomunikací
- příjemce (25.03.2003 - nezadáno)

Zdroje financování

Grantová agentura České republiky - Standardní projekty
- plně financující (25.03.2003 - nezadáno)

Výsledky

RAJMIC, P. Exact Risk Analysis of Wavelet Spectrum Thresholding Rules. In ICECS 2003 Proceedings. Sharjah, United Arab Emirates: Sharjah University, 2003. p. 455 ( p.)
Detail

RAJMIC, P. Využití waveletové transformace a matematické statistiky pro separaci signálu a šumu. Vědecké spisy Vysokého učení technického v Brně Edice PhD Thesis. Edice PhD Thesis, sv. 289. Brno: Vysoké učení technické v Brně, 2005. s. 1 ( s.)ISBN: 80-214-2810-4. ISSN: 1213-4198.
Detail

SMÉKAL, Z. Methods for Analysing Discrete and Digital Systems. In Telecommunications and Signal Processing TSP-2004. 1.September 2004. Brno: VUT Brno, 2004. p. 115 ( p.)ISBN: 80-214-2684-5.
Detail

SMÉKAL, Z. Analytical Solution of Non-Homogenous Difference Equation of 2nd order with Complex Conjugate Roots of Characteristic Equation. In Proc. of the Interantional Conference RTT2004. Prague: Dep. of Telecommunications, CUT Prague, 2004. p. 1 ( p.)ISBN: 80-01-03063-6.
Detail

ZEZULA, R., MALENOVSKÝ, V., VRÁNA, J. Comparing basic methods of audio signal watermarking. In Telecommunications and signal processing TSP - 2004. SEI-UTKO, TSP 2004: VUT Brno, 2004. p. 1 ( p.)ISBN: 80-214-2684-5.
Detail

ZEZULA, R. Phase-changing method for audio signal watermarking. In 5. rocnik prehlidky doktorskych praci, konference, Elektrotechnika a informatika 2004, cast druha: Elektronika. Fakulta elektrotechnicka, Zapadoceska univerzita v Plzni: Západočeská univerzita v Plzni, 2004. p. 145 ( p.)ISBN: 80-7043-299-3.
Detail

GESCHEIDTOVÁ, E., SMÉKAL, Z., KUBÁSEK, R., BARTUŠEK, K. Equiripple Digital Filters in Quadrature Mirror Filter Banks for Nuclear Magnetic Tomograpfy. In APCCAS 2004. Tainan: IEEE Circuits and Systems Society, 2004. p. 713 ( p.)ISBN: 0-7803-8661-2.
Detail

VONDRA, M., VÍCH, R. Voice Conversion Based on Spectral Envelope Transformation. In Elektronishe Sprachsinalverabeitung. Cottbus: BTU Cottbus, 2004. p. 148 ( p.)ISBN: 3-937672-65-5.
Detail

RAJMIC, P. Programový balík ThreshLab pro MATLAB. In Sborník příspěvků 12. ročníku konference MATLAB 2004. Praha: HUMUSOFT s.r.o., 2004. s. 493 ( s.)ISBN: 80-7080-550-1.
Detail

RAJMIC, P. A Method for Real-Time Wavelet-Type Signal Processing. In Proceedings of the international conference RTT 2004. Praha: ČVUT v Praze, 2004. p. 1 ( p.)ISBN: 80-01-03063-6.
Detail

SYSEL, P. Optimization of FIR Filter on VLIW Digital Signal Processors. In Proceedings of Research in Telecommunication Technology 2004. Prague: CTU in Prague, Faculty of Electrical Engineering, 2004. p. 1 ( p.)ISBN: 80-01-03063-6.
Detail

SMÉKAL, Z., SYSEL, P. Optimalizace algoritmů v signálovém procesoru typu VLIW při využití intrinsic funkcí. In Sborník X. mezinárodní konference Moderní elektronické součástky 2004. Sdělovací technika. Brno: Sdělovací technika, s.r.o., 2004. s. 1 ( s.)ISSN: 0036-9942.
Detail

EKSLER, V. Separation of Two Delayed Acoustic Sources Using FIR Filters. In Proceedings EC-SIP-M 2005. Bratislava, Slovak Republic: STU Bratislava, 2005. p. 280 ( p.)ISBN: 80-227-2257-X.
Detail

Radek Zezula. Application of MCLT in Modified Patchwork Algotithm for Audio Watermarking. In Proceedings EC-SIP-M 2005. Bratislava, Slovak Republic: STU Bratislava, 2005. p. 334 ( p.)ISBN: 80-227-2257-X.
Detail

VONDRA, M. Voice Conversion Based on Nonlinear Spectrum Transformation. In SPEECH PROCESSING. Czech Republic: Radio Engineering and Electronics AS CR, 2004. p. 53 ( p.)ISBN: 80-86269-11-6.
Detail

Radek Zezula, Zdeněk Smékal. Robust audio watermarking in 2D-MCLT domain. In 28th International Conference, Telecommunications and Signal Processing TSP - 2005. 28th International Conference. Brno, Czech Republik: Electrical Engineering Society, 2005. p. 110 ( p.)ISBN: 80-214-2972-0.
Detail

Radek Zezula, Jaroslav Klimek. Audio Signals Watermarking in the MCLT Domain. In 6th International Conference, Research in Telecommunication Technology 2005, RTT 2005. Ostrava, Czech Republik: VŠB-Technical University of Ostrava, 2005. p. 679 ( p.)ISBN: 80-248-0897-8.
Detail

Vladimr Malenovsky, Ing. Zdenek Smekal, Prof., Ing. Ivan Koula, Ing. Optimal Step-Size LMS Algorithm Using Exponentially Averaged Gradient Vector. In Proceedings of the Intl. Conference EUROCON 2005. SVAZEK: R23 SIGNAL PROCESSING. Belgrade, Serbia and Montenegro: Belgrade, Serbia and Montenegro, 2005. p. 1554 ( p.)ISBN: 1-4244-0050-3.
Detail

Vladimir Malenovsky, Ing. Radek Zezula, Ing. Ivan Koula, Ing. Nonlinear Stochastic Gradient Algorithm with Variable Step-Size. In Proceedings of the Intl. Conference TSP 2005. 28. Brno: VUT Brno, 2005. p. 103 ( p.)ISBN: 80-214-2972-0.
Detail

Vladimir Malenovsky, Ing. Self-Orthogonalizing Adaptive Filter and its Application to Echo Cancellation. In Sborník příspěvků na IEEE Workshop Vršov 2005. 1. Brno: VUT Brno, 2005. p. 12 ( p.)ISBN: 80-214-3008-7.
Detail

Vladimir Malenovsky, Ing. Ivan Koula, Ing. Implementation of the DCT-LMS Algorithm for Acoustic Echo Cancellation and its efficiency. In Proceedings EC-SIP-M, 5th EURASIP Conference focused on Speech and Image Processing, Multimedia Communications and Services. 1. Bratislava: STU Bratislava, 2005. p. 40 ( p.)ISBN: 80-227-2257-X.
Detail

Petr Sysel. Statistical Based Voice Activity Detector. In Proceedings of 6th International Conference Research In Telecommunications Technology 2005. Technical University of Ostrava, 2005. p. 537 ( p.)ISBN: 80-248-0897-8.
Detail

P. Sysel. Voice Activity Detection based-on Statistic Models. In Proceedings of the 16th Conference Electronic Speech Signal Processing. Prague, Czech Republic: Academy of Science of the Czech Republic, Institute of Radio Engineering and Electronics, 2005. p. 175 ( p.)ISBN: 3-938863-17-X.
Detail

EKSLER, V. Evaluation of Blind Separated Signals Using Speech Recognition System. In EUROCON 2005 - The International Conference on "Computer as a tool", R23 Signal Processing, IEEE Catalog Number: 05EX1255C. Belgrade, Serbia and Montenegro: EUROCON, 2005. p. 1650 ( p.)ISBN: 1-4244-0050-3.
Detail

RAJMIC, P. Method for Wavelet-type Signal Processing in Real Time. In Proceedings of the 16th Conference Electronic Speech Signal Processing. Praha: TUDpress, 2005. p. 458 ( p.)ISBN: 3-938863-17-X.
Detail

VLACH, J. Modení hudební efekty využívající waveletovou transformaci. In Sborník konference: Elektrotechnika a informatika 2005, část druhá - Elektronika. Plzeň: Západočeská univerzita v Plzni, 2005. s. 149 ( s.)ISBN: 80-7043-374-4.
Detail

RAJMIC, P. Method for Real-time Signal Processing via Wavelet Transform. In Proceedings of the 3th International Conference on Non-Linear Speech Processing. Barcelona: Escola Universitaria Politecnica de Mataró, 2005. p. 214 ( p.)ISBN: 84-256-1365-5.
Detail

Jiří Přinosil. Systém podpory zpracování audio signálů. In Audio Technologies and Processing ATP 2005 Proceedings of the 6th Conference of Czech Student AES Section on Audio Technologies and Processing. Brno: Vysoké učení technické v Brně, 2005. s. 19-28. ISBN: 80-214-2925-9.
Detail

RAJMIC, P.; VLACH, J. Method of Segmented Wavelet Transform for Real-time Signal Processing. In Proceedings of Audio Technologies and Processing, ATP 2005. ČVUT v Praze, 2005. p. 36 ( p.)ISBN: 80-214-2925-9.
Detail

RAJMIC, P.; VLACH, J. Forward Segmented Wavelet Transform. In Proceedings of the 7th Nordic Signal Processing Symposium. Reykjavik, Island: IEEE, 2006. p. 162 ( p.)ISBN: 1-42244-0413-4.
Detail

VLACH, J.; RAJMIC, P. Using the Wavelet Transform in Real-time Digital Signal Processing. In ICSES '06 Internation Conference on Signals and Electronic Systems (Proceedings volume 2 of 2). Lodz, Poland: CMYK Studio Poligrafii i Reklamy, 2006. p. 721 ( p.)ISBN: 83-921172-5-5.
Detail

Radek Zezula, Jiří Mišurec. Exploiting the psychoacoustic model for audio signal watermarking. In 7th International Conference RTT 2006. Nové Město na Moravě: Brno University of Technology, 2006. p. 118 ( p.)ISBN: 80-214-3243-8.
Detail

Smékal, Z., Sysel, P. Digital Signal Processing Algprithm Optimization for VLIW Digital Signal Processors. In Proceedings of the Second International Symposium on Communications, Control and Signal Processing. Marrakech, Morocco: SuviSoft, Oy Ltd., Finland, 2006. p. 1 ( p.)ISBN: 2-908849-17-8.
Detail

GESCHEIDTOVÁ, E.; BARTUŠEK, K.; KUBÁSEK, R.; SMÉKAL, Z. Equiripple Digital Filters in Quadratur Mirror Filter Banks. In Proceedings of 10th International Conference on Communication Technology. Guilin, Čína: Institute of Electrical an Electronics Engineering, Beijing, 2006. p. 1309-1312. ISBN: 978-1-4244-0800-9.
Detail

RAJMIC, P.; VLACH, J. Forward and Inverse Segmented Wavelet Transform. In Research in Telecommunication Technology 2006 Proceedings - Part I. Nové město na Moravě: 2006. p. 134 ( p.)ISBN: 80-214-3243-8.
Detail

RAJMIC, P. Method for Real-Time Signal Processing via Wavelet Transform. In Nonlinear Analyses and Algorithms for Speech Processing (Revised Selected Papers, Springer LNAI 3817). Berlin, Germany: Springer, 2006. p. 368 ( p.)ISBN: 3-540-31257-9.
Detail

Jiří Přinosil, Jiří Schimmel. Supporting System for Education of Digital Audio Signals Processing on Digital Signal Processors. In ICSES´06 International Conference on Signals and Electronic Systems. Lodz, Poland: Technical University of Lodz, Institute of Circuit Theory, Metrology and Materials Science, 2006. p. 673-676. ISBN: 83-921172-5-5.
Detail

STEJSKAL, V.; ESPOSITO, A. Spectral flatness method based empty pause detection in noisy and clean speech conditions. In 16th Czech-German Workshop on Speech Processing. Praha: Institute of Radio Engineering and Electronics AS CR, 2006. p. 125 ( p.)ISBN: 8086269159.
Detail

VRÁNA, J., ČERMÁK, J., ZEZULA, R. Výpočet vlnkové transformace pomocí algoritmu "lifting". Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2004, č. 34, s. 1 ( s.)ISSN: 1213-1539.
Detail

Martin Vondra, Robert Vích. Speech Identity Conversion. Lecture Notes in Computer Science, 2005, vol. 2005, no. 3445, p. 421 ( p.)ISSN: 0302-9743.
Detail

KOULA,I. Výpočetní náročnost vícerozměrných časově-kmitočtový popisů signálů. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2005, roč. 2005, č. 9, s. 1 ( s.)ISSN: 1213-1539.
Detail

STEJSKAL, V.; SMÉKAL, Z.; ESPOSITO, A. Non-speech Activity Pause Detection in Noisy and Clean Speech Conditions. NATO Security through Science Series Sub-Series E: Human and Societal Dynamics, 2007, vol. 18, no. 4, p. 170-178. ISSN: 1574-5597.
Detail

Radek Zezula, Ivan Koula, Zdeněk Smékal. Využití RPS pro potlačování šumu v řečových signálech. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2006, roč. 2006, č. 12, s. 1 ( s.)ISSN: 1213-1539.
Detail

Přinosil, J., Schimmel, J. Digitální zpracování zvukových signálů na DSP pomocí plug-in modulů. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2005, roč. 2005, č. 34, s. 1-10. ISSN: 1213-1539.
Detail

DIBLÍK, J., SMÉKAL, Z. O řešení diferenční rovnice y (n+2) - 1,25y (n+1) + 0,78125y (n) = x (n+2) - x(n). Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2005, roč. 2005, č. 1, s. 1 ( s.)ISSN: 1213-1539.
Detail

Jiri Schimmel, Jiri Prinosil. Digital Audio Signal Processing in DSP Using Plug-Ins. International Transaction on Computer Science and Engineering, 2005, vol. 2005, no. 12, p. 149-155. ISSN: 1738-6438.
Detail

STEJSKAL, V. Detekce pauz v řeči. Zvýrazňování řečového signálu zamaskovaného v šumu. 2006. s. 1 ( s.)
Detail

ZEZULA, R.; MIŠUREC, J. Audio Signal Watermarking with the Aid of 2D Pattern in MCLT Domain. ACM portal, Association for Computing Machinery, ACM, Inc., 2006.
Detail

RAJMIC, P. Využití waveletové transformace pro separaci užitečného signálu od šumu. Praha: ÚREL AVČR Praha, 2004. s. 1 ( s.)
Detail

SMÉKAL, Z., SYSEL, P. Optimalizace algoritmů v signálovém procesoru typu VLIW při využití intrinsic funkcí. Brno: Sdělovací technika, s.r.o., 2004. s. 1 ( s.)
Detail

SMÉKAL, Z., SYSEL, P. Optimalizace algoritmů v signálovém procesoru typu VLIW při využití intrinsic funkcí. Sdělovací technika, s.r.o., 2004. s. 1 ( s.)
Detail

VONDRA, M. Transformace hlasu ve vokodérech a systémech TTS. 1. Brno: 2005. s. 0 ( s.)
Detail

RAJMIC, P.; KLIMEK, J. Removing crackle from an LP record via wavelet analysis. In Proceedings of the 7th International Conference on Digital Audio Effects DAF'x04. Napoli, Italy: Federico II University of Napoli, 2004. p. 100-104.
Detail