Detail projektu

Sofistikované potlačovače hluku a poruch při přenosu řečových signálů pro pevné a mobilní sítě nové generace

Období řešení: 01.01.2005 — 31.12.2008 Financování: Vnitřní projekty VUT

O projektu

V mobilních a pevných telekkomunikačních a počítačových sítích je nutné vyřešit základní problém odstranění parazitního hluku a šumu z rušeného řečového signálu. Cílem projektu je vyvinout původní techniku pro rozpoznání typu hluku, šumu nebo rušení v řečovém signálu, který je přenášen daným přenosovým kanálem, jeho vyhodnocení a sofistikované nasazení vhodné metody pro automatické potlačení rušení. Navržené metody budou optimalizovány a upraveny pro implementaci v signálovém procesoru. Dále je nutné zajistit automatickou rekonstrukci chybějících úseků řeči při jejich ztrátě nebo vlivem velkého zpoždění při přenosu. Konečným výsledkem celého projektu bude softwarové řešení pro použití v reálném prostředí nezávisle na konkrétní technické realizaci. Využití technologie je rozsáhlé od využití v mobilních a pevných telekomunikacích a internetu (mobilní telefony, ústředny pro mobilní sítě, ústředny 4. generace, VoIP apod. ), přes leteckou, automobilní a vojenskou komunikační techniku.

Popis anglicky
In mobile and solid telecommunication and computer networks there is a need to solve the basic problem concerning the separation of speech signal from undesirable noise. The aim of the project is to develop a technique for recognizing the type of noise in speech signal transmitted through the transmission channel, its evaluation, and application of a sophicticated method for noise suppresion. The proposed methods will be optimized in order to be suitable for implementation in digital signal processors. Further, it is necessary to ensure automated reconstruction of missing signal segments, caused by either their loss or a huge transmission delay. The final result of the project will be a software solution applicable in real-time environment, independent of the technical realization. There is a wide scope for the utilization of the technology, starting from communication networks (switchboards for GSM etc.), through internet (VoIP), and ending with airline or military communication.

Klíčová slova
jednokanálové metody zvýrazňování řeči; vícekanálové metody zvýrazňování řeči; automatická indentifikace rušení; číslicové zpracování signálu; číslicové zpracování řeči; signálové procesory; syntéza TTS

Klíčová slova anglicky
one-channel speech enhancement methods; multi-channel speech enhancement methods; automated indentification of noise; digital signal processing; digital signal processors; TTS synthesis

Označení

1ET301710509

Originální jazyk

čeština

Řešitelé

Smékal Zdeněk, prof. Ing., CSc.
- hlavní řešitel (30.11.2005 - nezadáno)

Útvary

Ústav telekomunikací
- příjemce (18.08.2004 - nezadáno)
ApS Brno
- spolupříjemce (01.01.2005 - nezadáno)
Ústav radiotechniky a elektroniky AV ČR
- spolupříjemce (01.01.2005 - nezadáno)

Zdroje financování

Akademie věd ČR - Granty výrazně badatelského charakteru zaměřené na oblast výzkumu rozvíjeného v současné době zejména v AV ČR
- částečně financující (18.08.2004 - nezadáno)

Výsledky

MIŠUREC, J. Integrators with current conveyors. In Applications of Electrical Engineering (AEE'05). Prague: WSEAS, 2005. p. 103 ( p.)ISBN: 960-8457-13-0.
Detail

Radek Zezula, Jaroslav Klimek. Audio Signals Watermarking in the MCLT Domain. In 6th International Conference, Research in Telecommunication Technology 2005, RTT 2005. Ostrava, Czech Republik: VŠB-Technical University of Ostrava, 2005. p. 679 ( p.)ISBN: 80-248-0897-8.
Detail

Vladimr Malenovsky, Ing. Zdenek Smekal, Prof., Ing. Ivan Koula, Ing. Optimal Step-Size LMS Algorithm Using Exponentially Averaged Gradient Vector. In Proceedings of the Intl. Conference EUROCON 2005. SVAZEK: R23 SIGNAL PROCESSING. Belgrade, Serbia and Montenegro: Belgrade, Serbia and Montenegro, 2005. p. 1554 ( p.)ISBN: 1-4244-0050-3.
Detail

Vladimir Malenovsky, Ing. Radek Zezula, Ing. Ivan Koula, Ing. Nonlinear Stochastic Gradient Algorithm with Variable Step-Size. In Proceedings of the Intl. Conference TSP 2005. 28. Brno: VUT Brno, 2005. p. 103 ( p.)ISBN: 80-214-2972-0.
Detail

Vladimir Malenovsky, Ing. Self-Orthogonalizing Adaptive Filter and its Application to Echo Cancellation. In Sborník příspěvků na IEEE Workshop Vršov 2005. 1. Brno: VUT Brno, 2005. p. 12 ( p.)ISBN: 80-214-3008-7.
Detail

Vladimir Malenovsky, Ing. Ivan Koula, Ing. Implementation of the DCT-LMS Algorithm for Acoustic Echo Cancellation and its efficiency. In Proceedings EC-SIP-M, 5th EURASIP Conference focused on Speech and Image Processing, Multimedia Communications and Services. 1. Bratislava: STU Bratislava, 2005. p. 40 ( p.)ISBN: 80-227-2257-X.
Detail

Petr Sysel. Statistical Based Voice Activity Detector. In Proceedings of 6th International Conference Research In Telecommunications Technology 2005. Technical University of Ostrava, 2005. p. 537 ( p.)ISBN: 80-248-0897-8.
Detail

P. Sysel. Voice Activity Detection based-on Statistic Models. In Proceedings of the 16th Conference Electronic Speech Signal Processing. Prague, Czech Republic: Academy of Science of the Czech Republic, Institute of Radio Engineering and Electronics, 2005. p. 175 ( p.)ISBN: 3-938863-17-X.
Detail

Martin Vondra, Robert Vích. Sound-Dependent Spectral Warping in Voice Identity Conversion. In Electronic Speech Signal Processing. Dresden: TUD press, 2005. p. 423 ( p.)ISBN: 3-938863-17-X.
Detail

Ivan Koula. Modification of mapping methods of spectrogram. In RTT 2005 proceedings, 6th International Conference. Ostrava: VŠB - Technical University of Ostrava, 2005. p. 1 ( p.)ISBN: 80-248-0897-8.
Detail

Ivan Koula. Potlačování šumu v reálném čase. In Sborník příspěvků konference Vršov 2005. Brno: Vysoké učení technické v Brně, studentská sekce IEEE, 2005. s. 1 ( s.)ISBN: 80-214-3008-7.
Detail

RAJMIC, P. Method for Wavelet-type Signal Processing in Real Time. In Proceedings of the 16th Conference Electronic Speech Signal Processing. Praha: TUDpress, 2005. p. 458 ( p.)ISBN: 3-938863-17-X.
Detail

VLACH, J. Modení hudební efekty využívající waveletovou transformaci. In Sborník konference: Elektrotechnika a informatika 2005, část druhá - Elektronika. Plzeň: Západočeská univerzita v Plzni, 2005. s. 149 ( s.)ISBN: 80-7043-374-4.
Detail

RAJMIC, P.; VLACH, J. Method of Segmented Wavelet Transform for Real-time Signal Processing. In Proceedings of Audio Technologies and Processing, ATP 2005. ČVUT v Praze, 2005. p. 36 ( p.)ISBN: 80-214-2925-9.
Detail

Jiří Mišurec Ivan Koula. Computation complexity of time-frequency representation of signals. In Applications of Electrical Engineering (AEE '05). Prague: WSEAS, 2005. p. 167-170. ISBN: 960-8457-13-0.
Detail

RAJMIC, P.; VLACH, J. Forward Segmented Wavelet Transform. In Proceedings of the 7th Nordic Signal Processing Symposium. Reykjavik, Island: IEEE, 2006. p. 162 ( p.)ISBN: 1-42244-0413-4.
Detail

SCHIMMEL, J.; PŘINOSIL, J. Surveillance System for Audio Broadcast. In 7th Nordic Signal Processing Symposium NORSIG 2006. Reykjavik, Icelnad: 2006. p. 298-301. ISBN: 978-1-4244-0412-4.
Detail

VRÁNA, J. Unconventional Structure of Filter Bank. In POSTER 2006. Praha: ČVUT Praha, 2006. p. 1 ( p.)
Detail

SYSEL, P. Statistical Based Voice Activity Detector. In Proceedings of International Conference on Signals and Electronic Systems. Lodz, Poland: Lodz, 2006. p. 687 ( p.)ISBN: 83-921172-5-5.
Detail

VRÁNA, J., LUKL, T. Dual Channel Quadrature Mirror Filter Bank Containing Sigma-Delta Modulators. In XLI International Scientific Conference on Information, Communication and Energy Systems and Technologier. Sofie, Bulharsko: KING Ltd., 2006. p. 136-139. ISBN: 978-954-9518-37-5.
Detail

VONDRA, M., VÍCH, R. Pseudo Cepstrogram and Its Application to Speech Analysis. In Analysis of Biomedical Signals and Images. Brno Univerzity of Technology: Vutium Press, 2006. p. 54 ( p.)ISBN: 80-214-3152-0.
Detail

Martin Vondra, Robert Vích. Frequency and spectrum transformation in speech enhancement. In Elektronische Sprachsignalverarbeitung. TU Dresden: TUD press, 2006. p. 70 ( p.)ISBN: 3-938863-74-9.
Detail

Smékal, Z., Sysel, P. Digital Signal Processing Algprithm Optimization for VLIW Digital Signal Processors. In Proceedings of the Second International Symposium on Communications, Control and Signal Processing. Marrakech, Morocco: SuviSoft, Oy Ltd., Finland, 2006. p. 1 ( p.)ISBN: 2-908849-17-8.
Detail

RAJMIC, P.; VLACH, J. Forward and Inverse Segmented Wavelet Transform. In Research in Telecommunication Technology 2006 Proceedings - Part I. Nové město na Moravě: 2006. p. 134 ( p.)ISBN: 80-214-3243-8.
Detail

VONDRA, M.; VÍCH, R. Comb Filtering in Speech Enhancement. In 16th Czech-German Workshop SPEECH PROCESSING. Praha: IREE AS CR, 2006. p. 73-77. ISBN: 80-86269-15-9.
Detail

MALÝ, J.; RAJMIC, P. Performance of discrete wavelet transform lifting scheme approach. In Proceedings of the 12th IFIP International Conference. 2007. p. 231 ( p.)ISBN: 978-0-387-74158-1.
Detail

STEJSKAL, V.; SMÉKAL, Z.; ESPOSITO, A.; BOURBAKIS, N. The Significance of Empty Speech Pauses: Cognitive and Algorithmic Issues (IF 0,75). In Advances in Brain, Vision, and Artificial Intelligence. Lecture Notes in Computer Science. Tiergartenstrasse 17, 69121 Heidelberg, Germany: Springer, 2007. s. 1-618. ISBN: 978-3-540-75554-8.
Detail

PŘINOSIL, J.; VLACH, J. Human face localization in color images. In Proceedings of the 12th IFIP International Conference, Prague. 2007. p. 533-544. ISBN: 978-0-387-74158-1.
Detail

SMÉKAL, Z.; VÍCH, R. SNR-based Assessment of Quality of Speech Enhancement using Single-Channel Methods. In Studientexte zur Sprachkommujnikation, Elektronische Signalverarbeitung. Band 46. Germany: TUD Press, 2007. p. 149-154. ISBN: 978-3-940046-40-6.
Detail

VONDRA, M.; VÍCH, R. Adaptive Comb Filtering in Speech Enhancement by Spectral Subtraction. In Elektronische Sprachsignalverarbeitung. 1. Dresden: TUD press, 2007. p. 130-136. ISBN: 978-3-940046-40-6.
Detail

VONDRA, M.; VÍCH, R. Speech Spectrum Envelope Modeling. In Verbal and Nonverbal Commun. Behaviours. LNAI. Berlin Heidelberg: Springer-Verlag, 2007. p. 129-137. ISBN: 3-540-76441-0.
Detail

MALÝ, J.; RAJMIC, P. Watermarking Schemes for DWT-based Image Codec. In Proceedings of the International Conference on Computer Science and Information Technologies. Lviv, Ukraine: Lviv Polytechnic National University, 2007. p. 202-205. ISBN: 978-966-2191-06-6.
Detail

STEJSKAL, V.; ESPOSITO, A. Spectral flatness method based empty pause detection in noisy and clean speech conditions. In 16th Czech-German Workshop on Speech Processing. Praha: Institute of Radio Engineering and Electronics AS CR, 2006. p. 125 ( p.)ISBN: 8086269159.
Detail

J. Čermák, S. Araki, H. Sawada, S. Makino. Musical noise reduction in time-frequency-binary-masking-based blind source separation systems. In 16th Czech-German Workshop SPEECH PROCESSING. Praque: URE, 2006. p. 45 ( p.)ISBN: 86269159.
Detail

VONDRA, M.; VÍCH, R. Can ASR be Used for Evaluating Speech Quality?. In 17th Czech-German Workshop Speech Processing. 1. Praha: UFE AVČR, 2007. s. 115-121. ISBN: 978-80-86269-00-9.
Detail

ČERMÁK, J. Blind source separation using fuzzy masking. In SPEECH PROCESSING 17th Czech – German Workshop. Praque: UFE AVCR, 2007. p. 83-87. ISBN: 978-80-86269-00-9.
Detail

SYSEL, P.; SMÉKAL, Z. Power Spectral Density Noise Estimation using Wavelet Transform in Spectral Domain. In Proceedings of 17th Czech-German Workshop Speech Processing. Praha: 2007. p. 98-105. ISBN: 978-80-86269-00-9.
Detail

VONDRA, M.; VÍCH, R. Voice Connversion. In Summer School DATASTAT 06 Proceedings. Masaryk University, 2007. s. 281-292. ISBN: 978-80-210-4493-7.
Detail

RAJMIC, P.; MALÝ, J. Boundary Effects in the Wavelet Transform of Finite Discrete Signals. In Proceedings of the 30th International Conference Telecommunications and Signal Processing TSP-2007. Brno: VUT v Brně, 2007. p. 81 ( p.)ISBN: 978-80-214-3445-5.
Detail

RAJMIC, P.; VLACH, J. Real-time Audio Processing via Segmented Wavelet Transform. In Proceedings of the 10th International Conference on Digital Audio Effects (DAFx-07). Bordeaux: University of Bordeaux 1, 2007. p. 55-58. ISBN: 978-88-901479-1-3.
Detail

VONDRA, M. Speech Enhancement using Cepstral Vocoder. In 17th Czech-German Workshop Speech Processing. 1. Praha: UFE AV ČR, 2007. s. 110-114. ISBN: 978-80-86269-00-9.
Detail

KOUŘIL, J.; SCHIMMEL, J. Tracking of Wireless Microphone Transmitter for Audio Signal Processing Algorithm Control. In Proceedings of 31th International Conference on Telecommunications and Signal Processing - TSP 2008. 1. Budapest: Asszisztencia Szervezo Kft., 2008. p. 1-4. ISBN: 978-963-06-5487-6.
Detail

RAJMIC, P.; VLACH, J.; VYORAL, J.; PRŮŠA, Z. Real-Time Wavelet Transform with Overlap of Signal Segments. In ICSES 2008 International Conference on Signals and Electronic Systems Proceedings. Krakov: AGH University of Science and Technology, 2008. p. 39-42. ISBN: 978-83-88309-47-2.
Detail

SMÉKAL, Z. Difference Equations with Forward and Backward Differences and Their Usage in Digital Signal Processor Algorithms. Radioengineering, 2006, vol. 2006, no. 2, p. 45 ( p.)ISSN: 1210-2512.
Detail

STEJSKAL, V.; SMÉKAL, Z.; ESPOSITO, A. Non-speech Activity Pause Detection in Noisy and Clean Speech Conditions. NATO Security through Science Series Sub-Series E: Human and Societal Dynamics, 2007, vol. 18, no. 4, p. 170-178. ISSN: 1574-5597.
Detail

SMÉKAL, Z., SYSEL, Z. Výkonné jádro pro embedded systémy. Sdělovací technika, 2006, roč. 2006, č. 10, 11, s. 8 ( s.)ISSN: 0036-9942.
Detail

MALÝ, J. Srovnání metod pro ztrátovou kompresi obrazu. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2006, roč. 2006, č. 10, s. 1 ( s.)ISSN: 1213-1539.
Detail

VLACH, J.; RAJMIC, P.; PŘINOSIL, J.; VYORAL, J.; MÍČA, I. Optimized discrete wavelet transform to real-time digital signal processing. Mobile and Wireless Communication Networks, 2007, vol. 2007, no. 9, p. 514-520. ISSN: 1571-5736.
Detail

VRÁNA, J. Newtonova iterační metoda aplikovaná na funkce. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2007, roč. 2007, č. 38, s. 1-13. ISSN: 1213-1539.
Detail

MALÝ, J.; RAJMIC, P. Fast lifting wavelet transform and its implementation in Java. Mobile and Wireless Communication Networks, 2007, vol. 2007, no. 9, p. 488-496. ISSN: 1571-5736.
Detail

PŘINOSIL, J.; VLACH, J. Face detection in image with complex background, Springer Verlag. Mobile and Wireless Communication Networks, 2007, vol. 2007, no. 9, p. 533-544. ISSN: 1571-5736.
Detail

SMÉKAL, Z.; SYSEL, P. Enhanced estimation of power spectral density of noise, Springer Verlag. Personal Wireless Communications, 2007, vol. 245, no. 2, p. 521-532. ISSN: 1861-2288.
Detail

VLACH, J.; PŘINOSIL, J. Lokalizace obličeje v obraze s komplexním pozadím. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2007, roč. 2007, č. 04, s. 1 ( s.)ISSN: 1213-1539.
Detail

Jan Čermák, Miroslav Balík. Přístupy k modelování prozodie v TTS systémech. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2005, roč. 2005, č. 50, s. 1 ( s.)ISSN: 1213-1539.
Detail

PŘINOSIL, J.; KROLIKOWSKI, M. Využití detektoru Viola-Jones pro lokalizaci obličeje a očí v barevných obrazech. Elektrorevue - Internetový časopis (http://www.elektrorevue.cz), 2008, roč. 2008, č. 31, s. 1-16. ISSN: 1213-1539.
Detail

SMÉKAL, Z.; STEJSKAL, V.; ESPOSITO, A. Cognitive Role of Speech Pauses and Algorithmic Consideration for their Processing. INTERNATIONAL JOURNAL OF PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE, 2008, vol. 22, no. 5, p. 1073-1088. ISSN: 0218-0014.
Detail

SMÉKAL, Z.; SYSEL, P. Single-Channel Noise Suppression by Wavelets in Spectral Domain. Lecture Notes in Computer Science, 2007, vol. 4775, p. 150-164. ISSN: 0302-9743.
Detail

PŘINOSIL, J.; SMÉKAL, Z.; ESPOSITO, A. Combining Features for Recognizing Emotional Facial Expressions in Static Images. Lecture Notes in Computer Science, 2008, vol. 2008, no. 5042, p. 59-72. ISSN: 0302-9743.
Detail

PŘINOSIL, J.; MÍČA, I.; KROLIKOWSKI, M. Face and Eyes Localization in Color Images Using the Viola-Jones Detector. International Transaction on Computer Science and Engineering, 2008, vol. 49, no. 1, p. 169-176. ISSN: 1738-6438.
Detail

SMÉKAL, Z.; SYSEL, P. Enhanced Estimation of Power Spectral Density of Noise using the Wavelet Transform. In Personal Wireless Communications. SSCS. USA: Springer, 2007. p. 521-532. ISBN: 978-0-387-74159-8.
Detail

STEJSKAL, V.; ČERMÁK, J. Using fuzzy system for prosody modelling. In Electronic Speech Signal Processing, Proceedings of the 16th Conference Joined with the 15th Czech-German Workshop "Speech Processing". Studientexte zur Sprachkommunikation. Dresden: TUDpress, 2005. p. 84-90. ISBN: 393886317X.
Detail

Radomír Kurečka Zdeněk Bouša Petr Dub Petr Sysel. Databáze nahrávek řeči. Brno, Czech Republic: 2006. s. 1 ( s.)
Detail

BOUŠA, Z.; KUREČKA, R.; SMÉKAL, Z.; SYSEL, P. Modulární aplikace zvýrazňování řeči v signálových procesorech. Výzkumná zpráva k projektu AV ČR ev. č. 1ET301710509. 1ET301710509. 2007. s. 1-42.
Detail

RAJMIC, P. The Algorithm of Segmented Wavelet Transform. Poster na mezinárodní konferenci Trends in Harmonic Analysis. Trends in Harmonic Analysis. Strobl, Austria: 2007. p. 1 ( p.)
Detail

SYSEL, P.; SMÉKAL, Z.; VÍCH, R.; VONDRA, M. Metody potlačení hluku a rušení v řeči a možnosti a jejich implementace v mikroprocesorech a signálových procesorech. Praha: Akademie věd České republiky, 2010. s. 1-18.
Detail

SYSEL, P. Jednokanálová metoda zvýraznění řeči s využitím waveletové transformace v kmitočtové oblasti Vedoucí disertační práce byl prof. Ing. Zdeněk Smékal, CSc. Brno: VUT v Brně, 2007. s. 1-108.
Detail

Radomír Kurečka Zdeněk Bouša Petr Dub Petr Sysel. Databáze nahrávek řeči. Brno, Czech Republic: 2006. s. 1 ( s.)
Detail

Radomír Kurečka Zdeněk Bouša Petr Dub Petr Sysel: DRNv1.0; Software pro databázi nahrávek řeči. ApS Brno Božetěchova 2 612 66 Brno. (funkční vzorek)
Detail