Conference Paper

Speech enhancement for non-stationary noise environment by adaptivewavelet packet

Dept. of Electr. & Comput. Eng., Hanyang Univ.
DOI: 10.1109/ICASSP.2002.5743779 Conference: Acoustics, Speech, and Signal Processing, 2002. Proceedings. (ICASSP '02). IEEE International Conference on, Volume: 1
Source: IEEE Xplore

ABSTRACT We consider the non-stationary or colored noise estimation by wavelet thresholding method. First, we propose node dependent thresholding for adaptation in colored or non-stationary noise. Next, we suggest a noise estimation method based on spectral entropy using histogram of intensity instead of estimation method based on median absolute deviation (MAD). We use a modified hard thresholding to alleviate time-frequency discontinuities. The proposed methods are evaluated on various noise conditions - white Gaussian noise, car interior noise, F-16 cockpit noise, pink noise, speech babble noise. We compare our proposed methods with the conventional one with level dependent thresholding based on MAD

1 Follower
 · 
75 Views
  • Source
    • "Also some other thresholding functions were proposed in Chang et al. (2002) and Sheikhzadeh and Abutalebi (2001). "
    [Show abstract] [Hide abstract]
    ABSTRACT: In this paper, we propose a new speech enhancement system using the wavelet thresholding algorithm. The basic wavelet thresholding algorithm has some defects including the assumption of white Gaussian noise (WGN), malfunction in unvoiced segments, bad auditory quality, etc. In the proposed system, we introduce a new algorithm which does not require any voiced/unvoiced detection system. Also, in this proposed method adaptive wavelet thresholding and modified thresholding functions are introduced to improve the speech enhancement performance as well as the automatic speech recognition (ASR) accuracy. A new voice activity detector (VAD) was designed to update noise statistics in the proposed speech enhancement system when facing to the colored and non-stationary noises. The proposed method was evaluated on several speakers and under various noise conditions including white Gaussian noise, pink noise, and multi-talker babble noise. The SNR and ASR results show that the new method highly improves the performance of speech enhancement algorithm based on the wavelet thresholding.
    Speech Communication 08/2006; DOI:10.1016/j.specom.2005.12.002 · 1.55 Impact Factor
  • Source
    • "In such methods, choice of a good threshold and thresholding function for reduction of noise in the wavelet domain is the challenging subject[7] [10] [11] [12]. Recently, a novel approach for noise reduction using the wavelet thresholding has been proposed by Donoho[7]. "
    [Show abstract] [Hide abstract]
    ABSTRACT: In this paper we propose a new approach for speech enhancement. The method used to remove the noise components is a combination of two methods: Wavelet de-noising and spectral subtraction. The idea is to apply the spectral subtraction to wavelet approximations and details coefficients. A new parameter for spectral subtraction in unvoiced speech frames is introduced and the existing power factor in spectral subtraction method is improved. Also, for reduction of musical noise, we propose to use iterative Wiener filtering. Experimental results demonstrate that the proposed speech enhancement algorithm is very promising.
  • Source
    [Show abstract] [Hide abstract]
    ABSTRACT: Cette thèse développe plusieurs contributions pour le traitement du signal et des images ainsi que pour la vision par ordinateur. La première partie inclut un nouvel algorithme de débruitage des sons et un algorithme de super-résolution pour l'agrandissement des images. Ces algorithmes sont basés sur de nouvelles représentations parcimonieuses par blocs. Une procédure de seuillage par bloc temps-fréquence est introduite pour le débruitage audio, qui permet de réduire le bruit sans introduire d'artefacts, avec des résultats perceptuels et numériques nettement supérieurs à l'état de l'art. Cette première partie introduit aussi un nouveau cadre mathématique et algorithmique pour des problèmes inverses, avec une régularisation non-linéaire sur des dictionnaires de blocs géométriques dans une représentation parcimonieuse. Une approche générale pour la super-résolution d'images est introduite et des résultats numériques améliorant l'état de l'art sont obtenus. La deuxième partie de la thèse introduit un algorithme (ASIFT) de mise en correspondance d'images, qui est invariant relativement à des transformations affines. Il est démontré que cet algorithme satisfait les contraintes d'invariance et qu'il peut effectuer des correspondances entre des objets observés sous des angles arbitraires. Sa complexité numérique est du même ordre que les algorithmes les plus efficaces, avec une robustesse bien supérieure grâce à son invariance affine. La troisième partie de la thèse introduit une implémentation biologiquement plausible de groupements visuels. Inspiré par les mécanismes de synchronisation neuronale en groupement perceptuel, un algorithme général basé sur des oscillateurs neuronaux est proposé pour effectuer des groupements visuels. Cet algorithme permet d'obtenir des résultats prometteurs sur plusieurs problèmes, dont le groupement de points, l'intégration de contours, et la segmentation d'images.
Show more