Le projet MODIVOC

Systèmes MObiles et DIstribués à interface VOCale

Les objectifs

Les objectifs de cette recherche sont dirigés dans plusieurs axes complémentaires en vue d’apporter des solutions applicables à la globalité de la problématique rencontrée et ce sans se lier aux solutions technologiques actuelles compte tenu de l’évolution rapide de ces dernières :

  • Dans le domaine du traitement du signal, le présent projet cherche à reprendre fondamentalement l’étude de nos solutions en reconnaissance de la parole multilocuteur, non plus sur le seul critère de l’amélioration du taux de reconnaissance sans tenir compte de la complexité algorithmique, mais de trouver les meilleurs compromis afin de conserver le taux de reconnaissance le plus élevé possible tout en limitant la complexité associée à l’augmentation de la charge de calcul ainsi que les ressources mémoires. Ce travail permettra de proposer des solutions efficaces de reconnaissance multilocuteur dans un environnement mobile limité en puissance de calcul et ressource mémoire. Les mêmes démarches, quoique plus simples, doivent également être entreprises pour la synthèse de la parole. De plus, des solutions devront également être étudiées suivant les mêmes critères de simplification afin d’améliorer la robustesse au bruit ambiant réel.

     

  • Dans le domaine des systèmes mobiles, la puissance de calcul étant limitée, principalement par l’autonomie et les capacités de calcul et de mémoire des terminaux, le présent projet propose de travailler à l’optimalisation des charges de calcul entre les différentes ressources du système, à la fois au niveau des serveurs et des terminaux mobiles. Afin d’apporter des solutions simples, adaptables et extensibles, nous travaillerons sur base du système d'exploitation LINUX, de plus en plus populaire pour les applications mobiles (Embedded Linux et RT-Linux), et également disponible sur les serveurs et les ordinateurs de bureau.

     

  • Dans le domaine du génie logiciel, il est de plus en plus rare de voir les besoins d’un client couverts par un seul et unique logiciel développé d’une façon centralisée. En règle générale, différents composants actifs (logiciels maison, progiciels achetés, freeware, COTS components on the shelf…) souvent distribués coopèrent pour la réalisation des exigences. La technologie vocale étant appelée à être de plus en plus présente dans les applications de demain, il devient primordial de permettre à cette technologie de coopérer avec d’autres applications et de s’intégrer, facilement et à faible coût, dans des environnements existants. Des composants de reconnaissance vocale (ou de traitement de la voix en général) gagneraient d’une façon concurrentielle à avoir un modèle général et à être emballés par une (des) interface(s) générique(s) qui permettrai(en)t cette intégration. D’autre part, dans un contexte ou le monde industriel demande que le temps de développement soit de plus en plus rapide, posséder un modèle générique devrait permettre le transfert rapide des techniques avancées de technologie vocale réalisées dans un contexte d’utilisation particulier vers un autre contexte. La démarche proposée est d’étudier les besoins d’utilisation dans trois contextes aussi variés que le suivi médical, la logistique et la maintenance industrielle assistée, de construire des modélisations complètes pour arriver à proposer un modèle et des interfaces génériques qui faciliteraient nos objectifs de réutilisation et d’interopérabilité décrits ci-dessus.