Faculté Polytechnique de Mons

 

Travail de Fin d’Etudes

 

Débruitage par traitement de signal adaptatif :

Application à la reconnaissance automatique

de parole en milieu bruité

 

François Severin – 5e année Electricité

Promoteur : M. J. Hancq

 

 

L’objectif de ce travail est l’étude d’une méthode de débruitage en reconnaissance automatique de la parole. Cette méthode se base sur une technique déjà existante qui utilise le filtrage adaptatif afin d’estimer le bruit qui perturbe la commande vocale, pour le soustraire du signal bruité.

Les techniques existantes ont fait leurs preuves et apportent des résultats satisfaisants mais restent coûteuses en temps de calcul. Le but de ce travail est donc d’implémenter un algorithme de débruitage qui utilise un filtrage adaptatif qui s’avèrera moins coûteux que les techniques classiques.

 

Afin de trouver une solution à ce problème de coût, il faut se pencher sur les différentes étapes de transformation du signal vocal afin d’être mis en forme pour la reconnaissance vocale proprement dite. Or il s’avère qu’entre deux de ces étapes le signal est présenté sous une forme qui allègera les calculs des algorithmes adaptatifs. C’est donc entre ces deux étapes, en l’occurrence sur les séquences d’énergie en sous-bande du signal, que l’on a choisi d’effectuer l’opération de débruitage.

 

Les résultats sont satisfaisants, du moins en ce qui concerne une situation idéale au point de vue de l’acoustique, soit en milieu non réverbérant (c’est-à-dire qui ne présente pas d’écho).

En revanche, lorsque les conditions acoustiques deviennent plus contraignantes, les résultats deviennent décevants, et sont même inacceptables dans le cadre d’une application de reconnaissance vocale. Il a alors été nécessaire de se pencher davantage sur l’algorithme utilisé, ainsi que sur les hypothèses amenées par la méthode étudiée, afin d’en déduire la cause de ces mauvais résultats. Mais les améliorations testées n’ont pas été fructueuses.

 

En conclusion, la méthode étudiée fonctionne correctement lorsque la situation est idéale d’un point de vue acoustique, mais elle se montre beaucoup moins efficace dans des conditions plus générales.

Des perspectives existent cependant. Par exemple, le procédé de détection de la parole utilisé lors des simulations n’était pas très élaboré, il est donc possible de l’améliorer.

 

Mots-clés : reconnaissance, parole, bruit.