An Introductory Course on Speech Processing

Projects (2005-2006)

 

 

Projet 1 : Data Mining de données financières

Les techniques de Data mining
(voir http://www.ccsu.edu/datamining/resources.html) ont pour objectif de découvrir des régularités cachées dans et de prédire des tendances dans un grand ensemble de données brutes.

Ce projet expérimental consistera en une utilisation du traitement du signal statistique  et des réseaux de neurones sur des séries financières. En particulier, les modèles AR ou ARMA seront étudiés, ainsi que les modèles non-linéaires (modèles non-linéaires paramétriques, ou réseaux de neurones, p.ex.). On trouvera des bases de données financières en quantité sur http://gsbwww.uchicago.edu/fac/ruey.tsay/teaching/fts/.

L'ouvrage pour lequel ces données sont utilisées est disponible au service TCTS. 

Projet 2 : Analyse du génome humain

Sources :  

 http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml

 ftp://ftp.ics.uci.edu/pub/machine-learning-databases/molecular-biology/promoter-gene-sequences/

New Approaches for Time Series Expression Data

Many labs are now producing time series gene expression data sets, where multiple microarray assays are made at different time points in some biological process. One should be able to learn more from time series data than from the same number of unrelated replicates, since we can see the evolution of a process. However, the data is too sparse and noisy (and the genes to numerous) to use many standard time series analysis techniques.

 

You can find two clustering algorithms specifically designed to deal with time series data.

 

References:

 

A new approach to analyzing time series expression data

Cluster analysis of gene expression dynamics

http://www1.cs.columbia.edu/~cleslie/cs4761/new-ideas.html

http://www.pnas.org/cgi/content/abstract/99/14/9121  (paper uploaded)

 

Projet 3 : Synthèse de la voix chantée

Si la synthèse vocale est un problème plus ou moins résolu (du moins de façon satisfaisante pour les applications qui en découlent), la synthèse du chant reste un domaine peu exploré, et où les résultats restent en deça des espérances.

Le projet consistera en une réplication du principe utilisé dans un travail de maîtrise (http://www.ecel.ufl.edu/~bmasood/speech/index.html), en l'appliquant à une voix française. L'étudiant y apprendra à utiliser le modèle LPC dans tous ses détails et sera confronté à la mise au point d'une application réaliste en traitement de parole.

 

Projet 4 : Classification bayesienne naïve de textes

Il s’agit ici d’étudier l’application de la classification bayésienne au problème de la classification de textes, en vue de leur indexation. On se basera sur la note MATLAB : ./2005/bayes_texte.zip

Projet 5 : Etude de Réseaux de Neurones pour la Prédiction Linéaire et Non-Linéaire d’un signal de parole ou d’image – Application au Codage

Le but de ce projet est d’étudier l’exploitation de réseaux de neurones de type linéaire (perceptron) et non-linéaire (perceptron multi-couches) pour la prédiction d’un signal de parole ou d’image en vue de son codage. Les résultats seront analysés et critiqués tant d’un point de vue subjectif (qualité) qu’objectif (taux de compression, ordre de prédiction, entropie du signal d’erreur, faisabilité,…). Les résultats obtenus à l’aide d’un simple codage LPC pourront servir de référence à des fins de comparaison. Les tests s’effectueront sous Matlab. Une validation bibliographique de l’état de l’art pourra également être utile.

Ce projet est la continuation d’un travail similaire, entamé avec succès dans le cadre du codage de la parole uniquement.

Références :

·         Matlab 6, Signal Processing Toolbox, Neural Network Toolbox.

·         D. Vandromme, J.-Y. Parfait, « Application du réseau de neurones à la prédiction et au codage du signal de parole », Projet de TI2, FPMs, Décembre 2004.

 

Projet 6 : Etude de méthodes de Clustering pour la segmentation d’images en couleurs

Le but de ce projet est double. D’une part, il s’agit d’évaluer les performances de méthodes de clustering telles que « K-means » et « Fuzzy C-Means » pour la segmentation d’images en couleurs. D’autre part, ce problème-test sera également exploité afin d’évaluer et de comparer entre eux divers outils logiciels qui implémentent sous Matlab les algorithmes de clustering étudiés. Les tests s’effectueront sous Matlab.

Références :

·         Matlab 6, Image Processing Toolbox, Neural Network Toolbox.

·         Toolboxes “Clustering ” (et autres outils) :

http://www.cs.ucl.ac.uk/staff/D.Corney/ClusteringMatlab.htm l

 

Projet 7 : Codage d’image par Réseau de Neurones Convolutionnel : comparaison à JPEG2000

Le but de ce projet est de valider les performances de codage d’un réseau de neurones de type convolutionnel. Il s’agit dans un premier temps de relever l’évolution de la qualité d’image (tant objectivement que subjectivement) en fonction du taux de compression. Dans un second temps, une comparaison critique sera effectuée avec comme référence le standard émergeant JPEG 2000. Cette comparaison critique implique bien sûr l’étude des taux de compression/qualités respectifs, mais doit aussi prendre en compte les caractéristiques pratiques d’exploitation de tels systèmes de codage. Ce travail, d’une part, se basera sur un TFE qui a permis de développer un modèle de réseau de neurones convolutionnel pour le codage d’images, et d’autre part, impliquera une démarche personnelle pour la partie relative à la norme JPEG 2000.

Références :

·         J.-S. Gonsette, « Développement d'une bibliothèque logicielle pour la mise en oeuvre et l'apprentissage de réseaux de neurones à poids partagés - application au codage d'image », TFE,  Juin 2003.

·         Matlab 6, Image Processing Toolbox.

·         Liens utiles:        http://www.ifrance.com/jmfrfc/cnam/JP2_MATLAB/JP2_JM2000.html

     http://www.math.uu.nl/people/swart/jpg/jpg2000.pdf