Le projet MODIVOC

Systèmes MObiles et DIstribués à interface VOCale

Les Besoins

Les applications vocales sont amenées à un large développement au niveau des interfaces « homme-machine » dans de nombreux secteurs de l’activité humaine. Si des solutions efficaces commencent à exister dans des domaines d’applications comme les télécommunications, elles sont basées sur l’utilisation des serveurs vocaux recourant à des configurations hardware traditionnelles (ordinateur de bureau, serveurs, …). Ceux-ci réalisent diverses fonctions comme la reconnaissance vocale, la messagerie ou la synthèse vocale. Les applications communément citées sont :

  • la réservation en ligne (aviation, chemin de fer)
  • les services "intelligents" en téléphonie
  • les « call-centers ».

Pour ces applications, l’élément matériel de base reste l’utilisation d’une puissance informatique lourde, vu la complexité actuelle des algorithmes de traitement de la parole en général et, notamment, de la reconnaissance vocale multilocuteur et à large vocabulaire. Notons cependant l’existence d’applications simples pour des environnements mobiles (numérotation automatique sur les GSM), mais dont le niveau de reconnaissance est monolocuteur et dont le vocabulaire est très limité (quelques noms et chiffres). De plus, la robustesse de ces systèmes au bruit ambiant du monde réel est généralement très médiocre.

Les technologies de reconnaissance de la parole multilocuteur s’avèrent toutefois d’un potentiel d’utilisation très important dans les années à venir, en particulier dans d’autres applications comme :

  • la logistique
  • la maintenance industrielle assistée par ordinateur
  • l'informatisation du suivi médical d’un patient.

Les applications visées dans le cadre de MODIVOC nécessitent des solutions de reconnaissance de la parole multilocuteur, dont la complexité algorithmique est très supérieure aux systèmes monolocuteurs, ce qui implique une puissance de calcul non communément présente sur les plates-formes mobiles. Dans le but d’éviter une infrastructure lourde telle qu’utilisée actuellement et difficilement exploitable dans ces nouvelles applications, une solution est la décentralisation des tâches à mener et leur implantation progressive sur des systèmes mobiles de coût réduit reliés entre-eux par l’intermédiaire d’un réseau numérique sans fil. Actuellement, des solutions peu satisfaisantes existent déjà dans le cadre de la logistique. On note cependant que le niveau de reconnaissance minimaliste (par exemple 10 chiffres) de telles solutions en limite l’intérêt et le développement en reste limité quant aux avantages qu’elles représentent vis-à-vis des coûts d’investissement nécessaires à leur implantation. De plus, leur caractère extrêmement dédié à une seule application ne permet pas un transfert aisé des solutions proposées vers d’autres applications semblables.

Le projet MODIVOC vise à mener à bien cette nouvelle structuration des interfaces « homme-machine » en recherchant des solutions par :

  • la simplification des algorithmes de reconnaissance multilocuteurs,
  • l’augmentation de leur robustesse au bruit,
  • la répartition optimale de la charge de calcul en environnement mobile et distribué,
  • la spécification de modèles génériques qui permettraient l’intégration de la solution dans un environnement applicatif hétérogène.