An Introductory Course on Speech Processing
|
|
Projects
(2005-2006) |
|
|
|
|
|
|
|
Projet
1 : Data Mining de données financières
Les
techniques de Data mining Ce
projet expérimental consistera en une utilisation du traitement du signal
statistique et des réseaux de neurones
sur des séries financières. En particulier, les modèles AR ou ARMA seront
étudiés, ainsi que les modèles non-linéaires (modèles non-linéaires
paramétriques, ou réseaux de neurones, p.ex.). On trouvera des bases de
données financières en quantité sur http://gsbwww.uchicago.edu/fac/ruey.tsay/teaching/fts/. L'ouvrage
pour lequel ces données sont utilisées est disponible au service TCTS. Projet
2 : Analyse du génome humain
Sources : http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml
ftp://ftp.ics.uci.edu/pub/machine-learning-databases/molecular-biology/promoter-gene-sequences/
New Approaches for Time Series Expression Data Many labs are now producing time series gene expression data sets,
where multiple microarray assays are made at different time points in some
biological process. One should be able to learn more from time series data
than from the same number of unrelated replicates, since we can see the
evolution of a process. However, the data is too sparse and noisy (and the
genes to numerous) to use many standard time series analysis techniques. You can find two clustering algorithms specifically designed to deal
with time series data. References: A new approach to analyzing time series expression data Cluster analysis of gene expression dynamics http://www1.cs.columbia.edu/~cleslie/cs4761/new-ideas.html
http://www.pnas.org/cgi/content/abstract/99/14/9121 (paper uploaded) Projet 3 :
Synthèse de la voix chantée Si la
synthèse vocale est un problème plus ou moins résolu (du moins de façon
satisfaisante pour les applications qui en découlent), la synthèse du chant
reste un domaine peu exploré, et où les résultats restent en deça des
espérances. Le
projet consistera en une réplication du principe utilisé dans un travail de
maîtrise (http://www.ecel.ufl.edu/~bmasood/speech/index.html),
en l'appliquant à une voix française. L'étudiant y apprendra à utiliser le
modèle LPC dans tous ses détails et sera confronté à la mise Projet 4 : Classification
bayesienne naïve de textes Il s’agit ici
d’étudier l’application de la classification bayésienne au problème de la
classification de textes, en vue de leur indexation. On se basera sur Projet 5 : Etude de Réseaux de Neurones pour Le but de ce projet est d’étudier
l’exploitation de réseaux de neurones de type linéaire (perceptron) et non-linéaire
(perceptron multi-couches) pour la prédiction d’un signal de parole ou
d’image en vue de son codage. Les résultats seront analysés et critiqués tant
d’un point de vue subjectif (qualité) qu’objectif (taux de compression, ordre
de prédiction, entropie du signal d’erreur, faisabilité,…). Les résultats
obtenus à l’aide d’un simple codage LPC pourront servir de référence à des
fins de comparaison. Les tests s’effectueront sous Matlab. Une validation
bibliographique de l’état de l’art pourra également être utile. Ce projet est la continuation d’un
travail similaire, entamé avec succès dans le cadre du codage de la parole
uniquement. Références : ·
Matlab 6, Signal Processing Toolbox, Neural Network Toolbox. ·
D. Vandromme, J.-Y. Parfait,
« Application du réseau de neurones à la prédiction et au codage du
signal de parole », Projet de TI2, FPMs, Décembre 2004. Projet 6 : Etude de méthodes de Clustering pour la segmentation
d’images en couleurs Le but de ce projet est double.
D’une part, il s’agit d’évaluer les performances de méthodes de clustering
telles que « K-means » et « Fuzzy C-Means » pour la
segmentation d’images en couleurs. D’autre part, ce problème-test sera
également exploité afin d’évaluer et de comparer entre eux divers outils
logiciels qui implémentent sous Matlab les algorithmes de clustering étudiés.
Les tests s’effectueront sous Matlab. Références : ·
Matlab 6, Image Processing Toolbox, Neural Network Toolbox. ·
Toolboxes “Clustering ” (et autres outils) : http://www.cs.ucl.ac.uk/staff/D.Corney/ClusteringMatlab.htm
l Projet 7 : Codage d’image par Réseau de Neurones
Convolutionnel : comparaison à JPEG2000 Le but de ce projet est de valider
les performances de codage d’un réseau de neurones de type convolutionnel. Il
s’agit dans un premier temps de relever l’évolution de la qualité d’image
(tant objectivement que subjectivement) en fonction du taux de compression.
Dans un second temps, une comparaison critique sera effectuée avec comme
référence le standard émergeant JPEG 2000. Cette comparaison critique
implique bien sûr l’étude des taux de compression/qualités respectifs, mais
doit aussi prendre en compte les caractéristiques pratiques d’exploitation de
tels systèmes de codage. Ce travail, d’une part, se basera sur un TFE qui a
permis de développer un modèle de réseau de neurones convolutionnel pour le
codage d’images, et d’autre part, impliquera une démarche personnelle pour la
partie relative à Références : ·
J.-S. Gonsette, « Développement d'une bibliothèque
logicielle pour la mise en oeuvre et l'apprentissage de réseaux de neurones à
poids partagés - application au codage d'image », TFE, Juin 2003. ·
Matlab 6, Image Processing Toolbox. ·
Liens utiles: http://www.ifrance.com/jmfrfc/cnam/JP2_MATLAB/JP2_JM2000.html http://www.math.uu.nl/people/swart/jpg/jpg2000.pdf
|
|
|
|