Faculté Polytechnique de Mons
Débruitage par traitement de
signal adaptatif :
Application à la
reconnaissance automatique
de parole en milieu bruité
François Severin – 5e
année Electricité
Promoteur : M. J. Hancq
L’objectif de ce travail est l’étude d’une méthode de débruitage en reconnaissance automatique de la parole. Cette méthode se base sur une technique déjà existante qui utilise le filtrage adaptatif afin d’estimer le bruit qui perturbe la commande vocale, pour le soustraire du signal bruité.
Les techniques existantes ont
fait leurs preuves et apportent des résultats satisfaisants mais restent
coûteuses en temps de calcul. Le but de ce travail est donc d’implémenter un
algorithme de débruitage qui utilise un filtrage adaptatif qui s’avèrera moins
coûteux que les techniques classiques.
Afin de trouver une solution à ce problème de coût, il faut se pencher sur les différentes étapes de transformation du signal vocal afin d’être mis en forme pour la reconnaissance vocale proprement dite. Or il s’avère qu’entre deux de ces étapes le signal est présenté sous une forme qui allègera les calculs des algorithmes adaptatifs. C’est donc entre ces deux étapes, en l’occurrence sur les séquences d’énergie en sous-bande du signal, que l’on a choisi d’effectuer l’opération de débruitage.
Les résultats sont
satisfaisants, du moins en ce qui concerne une situation idéale au point de vue
de l’acoustique, soit en milieu non réverbérant (c’est-à-dire qui ne présente
pas d’écho).
En
revanche, lorsque les conditions acoustiques deviennent plus contraignantes,
les résultats deviennent décevants, et sont même inacceptables dans le cadre
d’une application de reconnaissance vocale. Il a alors été nécessaire de se pencher davantage sur l’algorithme utilisé,
ainsi que sur les hypothèses amenées par la méthode étudiée, afin d’en déduire
la cause de ces mauvais résultats. Mais les améliorations testées n’ont pas été
fructueuses.
En conclusion, la méthode étudiée fonctionne
correctement lorsque la situation est idéale d’un point de vue acoustique, mais
elle se montre beaucoup moins efficace dans des conditions plus générales.
Des perspectives existent cependant. Par exemple, le procédé de détection de la parole utilisé lors des simulations n’était pas très élaboré, il est donc possible de l’améliorer.
Mots-clés :
reconnaissance, parole, bruit.