>
TCTS Lab Seminars
 
 

MULTITEL - TCTS seminars in chronological order

    ANALYSE DE SEQUENCES D'IMAGES POUR LES APPLICATIONS TRANSPORT

    When?

    Friday, Jan. 27th, 2006, 10:00

    Who?

    François Cabestaing , LAGIS Lab

    What?

    Dans ce premier exposé, je présenterai les activités de recherche menées au LAGIS dans le domaine du traitement des séquences d'images numériques, avec comme champ applicatif l'amélioration de la sécurité dans les moyens de transports terrestres. Plusieurs aspects liés à l'intégration d'un système de vision artificielle dans un véhicule ou dans une infrastructure sont abordés, à savoir le développement des algorithmes spécifiques, la conception d'architectures dédiées servant de supports à ces algorithmes et la validation expérimentale des dispositifs.

    CLASSIFICATION DES SIGNAUX DANS UNE INTERFACE CERVEAU-ORDINATEUR  - (BCI)

    When?

    Friday, Jan. 27th, 2006

    Who?

    François Cabestaing , LAGIS Lab

    What?

    Dans le deuxième exposé, je présenterai les résultats obtenus avec plusieurs collègues américains durant mon séjour à Albany
    en congé sabbatique en 2003. Nous avons comparé différentes techniques de traitement et de classification des signaux d'EEG
    permettant d'extraire des informations pertinentes pour la communication handicapé / ordinateur. La comparaison a été
    réalisée sur des données acquises pendant plusieurs mois sur 8 individus.

    EXPLOITATION DE LA COULEUR POUR L'ANALYSE AUTOMATIQUE D'IMAGES NUMERIQUES

    When?

    Friday, Jan. 27th, 2006

    Who?

    Ludovic Macaire, LAGIS Lab

    What?

    Cette présentation traite du traitement automatique des images numériques couleur, dont l'objectif est de parvenir à interpréter le contenu d'une image analysée. La chaîne de traitements d'une image couleur se décompose en plusieurs étapes successives qui partent de l'analyse de la couleur de chaque pixel pour obtenir une interprétation du contenu de l'image. Une fois l'image couleur acquise par la caméra, se pose la question du choix de l'espace de représentation de la couleur qui est le mieux adapté aux traitements à effectuer sur l'image. Dans la première partie, nous décrivons la détermination d'espaces couleur hybrides adaptés à des problèmes spécifiques d'analyse d'images. La seconde partie est dédiée à la segmentation par classification de pixels qui tient compte des propriétés couleur et spatiales des pixels. La dernière partie est dédiée à la reconnaissance d'objets éclairés avec différents illuminants. Nous y présentons un modèle original qui décrit les variations des couleurs des pixels provoquées par des changements d'illuminant. Un des champs d'application potentielle concerne la surveillance de sites publics.

    MISO Super-Resolution Text

    When?

    Wednesday, June 15th, 2005, 10:00

    Who?

    Céline Mancas-Thillou, TCTS Lab

    What?

    Due to the increased use of embedded low-resolution imaging devices, such as handheld PDAs and mobile phones, coupled with the need to extract information accurately and quickly, super-resolution (SR) based techniques are fast becoming a current focus of research in the field of text recognition. SR processes the information from one (or more) low-resolution, possibly noisy and blurred, image(s) of a scene to produce a higher-resolution image (or sequence). SR methods can be found in a multifarious range of imaging applications, such as remote sensing,
    microscopy and medical imaging, astronomical and space imaging, surveillance and forensic imaging and many more.

    While the area of super-resolution has been dealt with in fair depth in recent years, it is only just becoming useful as an applicable stage in improving text images, particularly for further processing, transmission, and understanding on mobile and handheld devices. After dealing with the general concepts of super-resolution, static super-resolution will be highlighted. Then the main processing stages involved will be described: motion estimation and registration, warping and reconstruction, and deblurring and denoising. As a specific case study, a  description of a simple algorithm implemented in the University of Bristol will follow by considering a camera-based text resolution enhancement algorithm towards an embedded application.

    Étude quantitative et qualitative de l'interprétation instrumentale et vocale

    When?

    Friday, June 10th, 2005, 10:00

    Who?

    Caroline Traube, Université de Montréal

    What?

    Le LIAM est affilié à la fois au secteur composition électroacoustique et au secteur musicologie de la Faculté de musique de l'Université de Montréal et accueille des chercheurs et étudiants provenant des différents domaines de la recherche en musique.

    Le LIAM se consacre principalement à l'étude quantitative et qualitative du phénomène de l'interprétation instrumentale et vocale, aux niveaux acoustique, gestuel et perceptif (en particulier dimensions perceptives et vocabulaire descripteur du timbre). Ce type d'étude vise en particulier à établir les relations entre paramètres structurels (dépendant de l'instrument), paramètres de jeu (dépendant de l'interprète) et attributs perceptifs du timbre instrumental.

    Cette présentation visera à exposer les recherches menées par différents membres du LIAM sur plusieurs instruments (guitare classique, piano, flûte,...). Nous présenterons également les recherches réalisées en collaboration avec Nicolas D'Alessandro, doctorant au sein du service de TCTS, basées sur les analogies perceptives entre sons de guitare et sons vocaux.

    The Human Visual System (HVS)

    When?

    Wednesday, April 20th, 2005, 10:00

    Who?

    Matei Mancas, TCTS Lab

    What?

    This is a brief description of the Human Visual System. First, the "hardware"  aspect of vision (acquisition : the eye(s)) will be treated followed by a quick approach of the "software" aspect of vision (analysis : the brain).

    In the first part the evolution of the "eye" and the different kind of eyes will be presented. A more detailed description of the human eye will be achieved.

    In the second part, we will see how the information goes to the brain and where exactly in the brain. Finally some interesting characteristics of our visual system related to pattern recognition will be shown.

    Synthèse de l'imitation vocale et représentation graphique des gestes
    phonétiques sous-jacents à la description du timbre de la guitare classique.

    When?

    Wednesday, March 23rd, 2005, 10:00

    Who?

    Nicolas D'Alessandro, TCTS Lab

    What?

    La guitare est un instrument qui permet la production d’une très vaste palette de timbres. Les guitaristes utilisent un large vocabulaire pour qualifier les timbres qu’ils produisent sur leur instrument. Ces adjectifs font référence aux différents domaines sensoriels : sombre, chocolaté, transparent, métallique, brillant, etc. Dans un contexte pédagogique, la signification de ce vocabulaire ne semble pas toujours être perçue clairement. L'objectif de cette recherche est de concevoir
    un outil informatique produisant la synthèse de l'imitation vocale ainsi que la représentation graphique des gestes phonétiques sous-jacents à la description du timbre de la guitare classique, en fonction des paramètres du geste instrumental et basé sur des analogies entre les sons de guitare et les sons vocaux. À l'image de la méthode traditionnelle d'enseignement du tabla, qui s'effectue à l'aide d'onomatopées, l'imitation vocale des timbres de guitare pourrait fournir un langage commun aux interprètes de la guitare, complémentaire à l'imagerie mentale qu’ils utilisent couramment.

    The TTSBOX: A matlab toolbox for teaching TTS

    When?

    Wednesday, March 16th, 2005, 10:00

    Who?

    Prof. Thierry Dutoit, TCTS Lab

    What?

    The paper presents a new toolbox for teaching TTS syn-thesis. TTSBOX performs the synthesis of Genglish (for ”Generic English”), an imaginary language obtained by re-placing English words by generic words. Genglish therefore has a rather limited lexicon, but its pronunciation maintains most of the problems encountered in natural languages.
    TTSBOX uses simple data-driven techniques (Bigrams, CA-RTs, NUUs) while trying to keep the code minimal, so as to keep it readable for students with reasonable MATLAB practice. TTSBOX was designed with the hope that it can help to increase the personal involvment of undergraduateand graduate students in their TTS courses.

    The paper providing details about the TTSBOX can be found at : http://tcts.fpms.ac.be/publications.html

    The 'Pronunciation Trainer'

    When?

    Wednesday, February 23rd, 2005, 10:00

    Who?

    Thomas Hansen, NISLab, Danmark

    What?

    My talk today will mainly center around a project in the area of computer assisted language learning, that I have been working on for a little over a year. The aim of the program is to teach pronunciation to foreigners arriving in Denmark for various reasons.
    The 'Pronunciation Trainer' consists of two separate yet interdependent pieces of programming, namely the so called Listening coach which was designed to take  perception theory into account and the Pronunciation trainer,  which allows you to interact with an ASR based piece of sofware that evaluates the intelligibility of your language.
    The program(s) attempt to take a pedagogical approach to language learning  while being aware of the shortcomings of present day technology.

    Brain-computer interfaces

    When?

    Friday, April 9th, 2004, 14:00

    Who?

    Burak Arslan

    What?

    A Brain Computer Interface is a device, which enables people to interact with computer-based systems through conscious (or semi conscious) control of their thoughts. In this talk, a brief survey on the BCI research will be presented with complimentary background info. Film lovers and conspiracy theoreticians are also invited to speculate about its present or possible use.

    Cross-Lingual Natural Language Technologies

    When?

    Wednesday, March 31st 2004, 16:00

    Who?

    Roberto Pieraccini, IBM T.J.Watson Research Center, Yorktown Heights, NY 10598

    What?

    The amount of information available and created each day is so large that humans cannot take advantage of it without the help of search and analysis programs. It is estimated today that 85% of the information is in an unstructured form, such as text, audio, video, images, etc., thus not readily available for automatic processing. For textual information we have the additional problem of different languages, which create a barrier to the consumption of information. Given the unstructured and multilingual nature of the information, research has to focus on various analysis techniques that would make it possible to extract structured information from raw natural language text in different idioms, alphabets, scripts and encodings. Those techniques, ranging from cross-lingual information retrieval and machine translation to semantic information extraction, are particularly suited to statistical machine learning approaches. In this talk I will give a general overview of the research in statistical natural language processing across different languages carried out at the IBM T.J. Watson Research Laboratories.

    Procédés d'analyse automatique du sommeil

    When?

    Friday 19/09/03, 14:00

    Who?

    Stéphanie Devuyst, TCTS Lab

    What?

    Etat de l'art des techniques d'analyse d'enregistrements polysomnographiques (Electoencéphalogrammes, électooculogramme, etc).
    L'objectif est de voir ce qui se fait en matière d'élimination des artéfacts, d'extraction de "features", et de classification en stades du sommeil.

    Draft Standard for Part 15.4 : Wireless Medium Access Control (MAC) and Physical Layer (PHY) specifications for Low Rate Wireless Personal Area Networks (LR-WPANS)

    When?

    Friday 08/08/03, 10:00

    Who?

    Baudry Hanotier, MULTITEL

    What?

    The new IEEE 802.15.4 protocol defines the physical layer and the MAC sublayer of the ISO-OSI stack. 802.15.4 is defined for Low Data Rate - Wireless Personal Area Networks (LR-WPANS). Such networks are used to convey information over short distances via radio communication. 802.15.4 is especially targeted for use with low complexity, ultra low cost and ultra low power consumption devices. It allows up to 255 devices to communicate at data rates of 20kb/s, 40kb/s or 250kb/s in an operating space of at least 10 meters.

    OntoCode, Interface multimodale pour la recherche d’informations guidée par ontologie

    When?

    Friday 14/02/03, 15:00

    Who?

    Davy Boonen, MULTITEL

    What?

    Présentation d’une interface multimodale pour la recherche d’informations guidée par une ontologie. On a implémenté un assistant d’encodage de données bio-médicales en J2SE. Cet outil est commandé par le clavier, la souris ou la voix. L’intégration de STRUT est rendue possible par l’interface JNI. Le vocabulaire pour la reconnaissance vocale est recompilé à la volée grâce à la structuration hiérarchique des données. Enfin, le réseau sémantique derrière l’ontologie bio-médicale (Unified Medical Language System) permet la classification automatique des concepts sélectionnés et propose des clusters de chemins alternatifs dans le même voisinage sémantique.

    A study about multisensor data fusion algorithms for trains

    When?

    Friday 07/02/03, 10:00

    Who?

    Silvio Dupont Fereira, MULTITEL

    What?

    The presentation describes the results of a study about multisensor data fusion algorithms that can be used for a train navigation system. It focuses on algorithms for sensor fault detection and isolation (FDI). The objective of the study was to provide Alstom Transport Charleroi with a survey of FDI algorithms in order to help them in the choice of odometry algorithm. The algorithms were implemented in Matlab and experimented with sensor measurements taken in real conditions. The results prove that the most effective FDI algorithm is based on Kalman filtering. The design is generic in the sense that it can be applied with any combination of sensors measuring any state variable (position, speed or acceleration).
    keywords: sensor fault detection and isolation ; kalman filtering

    XML et la standardisation des fichiers et données médicales

    Quand?

    Le mercredi 18/12/2002, 14:00

    Qui?

    M. Dominique Tesse, informaticien, CHU Charleroi

    Quoi?

    Un des futurs défis du monde médical est le transfert des données médicales via Internet. Ceci permet un gain de temps et d’argent. Cependant, ces transferts doivent être structurés sous peine d’anarchie. C’est à ce niveau qu’interviennent les technologies XML, qui permettent de structurer l’information. Nous verrons :

    • Le décor dans lequel se déroule les différentes conceptualisation (HL7, Open-EHCR,…)
    • La structure des messages et quelques explications relatives aux dictionnaires ;
    • le Xschéma développé pour les messages électroniques ;
    • la XSLT de validation complémentaire ;
    • une démonstration à partir du site web du groupe DATA ;

    Outils d'analyse et de recomposition des images pour la réalité mélangée

    Quand?

    Le mercredi 18/12/2002, 14:00

    Qui?

    Prof. B. Macq, Labo TELE, UCL

    Quoi?

    L'évolution dans les communications visuelles va vers le concept de composition de scène. L'objectif n'est plus seulement de réaliser le meilleur compromis débit-distorsion mais de fournir un ensemble d'objets visuels à un programme qui en fonction des activations de l'utilisateur va fournir une scène visuelle adaptée.
    Deux normes seront détaillées dans cet esprit. La norme MPEG-4 qui permet la composition de scènes hybrides synthétique-naturel par la segmentation et la re-composition d'objets et la norme JPEG-2000 qui fournit une représentation des images sous forme d'un train binaire flexible, particulièrement utile pour la navigation dans les méga-images.

    Utilisation des technologies Java, XML et PKI pour l'intégration d'applications eBusiness

    Quand?

    Le mercredi 11/12/2002, 15:00

    Qui?

    Eric Charles, Ir., Administrateur-délégué, U-Mangate , Parc Scientifique Initialis, Mons

    Quoi?

    A préciser.

    Les technologies vocales : présentation et applications (Transparents)

    Quand?

    Le mercredi 11/12/2002, 14:00

    Qui?

    F. Bataille, Ir, Directeur technique, BABEL TECHNOLOGIES S.A.

    Quoi?

    Babel Technologies est un fournisseur de technologies dans le domaine du traitement de la parole. Les algorithmes qui ont été développés permettent l'intégration dans n'importe quelle application :

    • de la reconnaissance de la parole (Automatique Speech Recognition ASR)
    • de la synthèse de la parole (Text To Speech TTS)
    • de la vérification du locuteur

    Un court résumé des technologies existantes sera suivi d'une présentation plus approfondie de celles utilisées par Babel Technologies.
    Ensuite, différents types d'applications utilisant ces technologies seront présentés.

    Level Set & Fast Marching methods : Discussion

    Quand?

    Le 03/12/2002, 10.30

    Qui?

    Raphael Sebbe

    Quoi?

    In this session, Raphael will give an overview of the Fast Marching & Level Set methods for solving interface evolution problems, their applications, as well as why and how they are used for image segmentation.

    Séminaire exceptionnel "Conception d'un système embarqué pour le spatial" chez ALCATEL-ETCA (Charleroi)

    Quand?

    Exceptionnellement, le JEUDI 28/11/2002, à 14:00

    Qui?

    à confirmer

    Quoi?

    L'après-midi sera consacrées à 4 exposés (à confirmer), dans les locaux d'ALCATEL-ETCA :

    • - Gestion du projet et contraintes du secteur
    • - Technologies utilisables
    • - Packaging
    • - Exemple de réalisation ETCA (probablement: système d'alimentation électrique d'un satellite)

    StrutSurfer: view, edit and play STRUT files.

    Quand?

    Le 22/11/2002, à 10.30

    Qui?

    Geoffrey Wilfart

    Quoi?

    StrutSurfer is a sound edition tool based on KTH's WaveSurfer, dedicated to the STRUT toolkit.

    Acquisition et traitement de signaux biomédicaux

    Quand?

    Le mercredi 6/11/2001, à 15:00

    Qui?

    E. Stanus, Dr Ir, directeur du service informatique du CHU Tivoli, à La Louvière.
    Etienne Stanus était adjoint au directeur gestionnaire de l'hôpital Erasme jusqu'en janvier 2001. Il a été chef de projet (signal multidimensionnel) chez Multitel ASBL, jusqu'en octobre 2002, date à laquelle il a pris ses nouvelles fonctions au CHU Tivoli. Il est également membre de la commission "Normes en matière de Télématique au service du secteur des Soins de Santé" (Ministère des Affaires Sociales, de la Santé Publique et de l'Environnement Administration des Soins de Santé)

    Quoi?

    Aperçu des techniques d'acquisition et de traitement des signaux les plus courants :

    • Électrophysiologie
    • EEG
    • EMG magnétoencéphalographie
    • cartographie de surface
    • ECG
    • vectocardiographie
    • Détection des ronflements et sybillances
    • Mesures d'audition, ...
    • Impédancemétrie: application en pneumologie
    • Imagerie médicale : imageurs RX, nucléaires, MR

    Le traitement d'images dans un environnement temps réel : la visionnique

    Quand?

    Le mercredi 6/11/2002, à 14:00 (à confirmer)

    Qui?

    P. REPJUK, Ir., Administrateur délégué de Capflow S.A.

    Quoi?

    La s.a. Capflow développe depuis 1995 un outil logiciel et matériel permettant le prototypage rapide d'applications visionniques temps réel. L'outil VisioFlex est constitué de cartes électroniques et de logiciels entièrement développés dans l'entreprise.

    • présentation brève de Capflow
    • exposé : les applications de la visionnique en milieu civil et industriel
    • présentation du concept VisioFlex (matériel et logiciel)
    • présentation des applications existantes construites avec l'outil Visio Flex
    • perspectives d'avenir

    Speech enhancement and the Multitel Aurora3 system

    Quand?

    Le 25/10/2002, à 10.30

    Qui?

    Stéphane Dupont

    Quoi?

    First, the talk will try to show the usefulness and the limitations of spectral subtraction and Wiener filtering for speech enhancement and recognition of speech under noisy/mismatched conditions. A Wiener filter implementation is available in STRUT. A demo of this implementation will be presented, based on STRUTSurfer. This talk is also intended to present the status of in-house work on the Aurora3 set of databases. An experimental setup has been developed as it was necessary to assess our speech recognition engine on these reference tasks (in addition to using the ETSI reference system). With the same kind of acoustic features, this system has similar performance than the ETSI system. Possible directions to improve the system will be proposed.

    Presentation of the strut2 train and log GUI.

    Quand?

    Le 18/10/2002, à 10.30

    Qui?

    Anders Eckersand

    Quoi?

    Installation of necessary packages. Showing the new GUI, and explanation of new features for training of models.

    Application des techniques d'annulation d'echo acoustique à la reconnaissance vocale

    Quand?

    Le 11/10/2002, à 10.30

    Qui?

    Mohammed Ben Aziz (TFE)

    Scoring - Confidence meausres

    Quand?

    Le 13/09/2002, à 10.30

    Qui?

    Laurent Couvreur

    Train dynamic state estimation by data fusion techniques

    When?

    Friday 26/06/02, 15:00

    Who?

    François Meers, MULTITEL

    What?

    The problem deals with multi-sensor data fusion applied to the localisation of trains. In short, trains are equipped with on-board speed and acceleration sensors that are used to provide an estimation of the position and of the speed of the train. This estimation must be completed with a confidence interval, as this odometric equipment is used for automatic monitoring of the train, which should be as safe as possible. The main difficulties arise from the following facts: - the sensors sometimes do not work properly; for instance, the accelerometer values are biased by the track slope, and the wheel speed sensors provide irrelevant information in case of slipping or sliding of the wheel on the track - the level of confidence required is as high as 10e-9, which severely complicates the confidence interval computation To cope with these problems, train manufacturers intend to add a radar and possibly satellite positioning to the current equipment, composed of wheel sensors and possibly an accelerometer. In terms of science disciplines, the problem deals with state estimation with unknown dynamics in a discrete and stochastic framework.

    Simulation de lignes téléphoniques

    Quand?

    Le 14/06/2002, à 10.30

    Qui?

    Gregory Lenoir (TFE)

    Pronunuciation Modeling

    Quand?

    Le 24/05/2002, à 10.30

    Qui?

    Sandrine Pouysegur

    ICSI + distributed speech recognition and the Aurora3 evaluation

    Quand?

    Le 17/05/2002, à 10.30

    Qui?

    Stéphane Dupont

    Quoi?

    This talk first give an overview of current research work at the International Computer Science Institute. Then, I will give a summary of the ETSI Aurora evaluation, which started 3 years ago and recently converged to the publication of a standard for distributed speech recognition. The algorithms that where developed for this competition will not be discussed here: this will be the subject of a future talk.

    Speaker Verification

    Quand?

    Le 26/04/2002, à 10.30

    Qui?

    Erhan Mengusoglu

    RAD and VoiceXML

    Quand?

    Le 26/04/2002, à 10.30

    Qui?

    Olivier Pietquin

    Voice Activity Detection

    Quand?

    Le 19/04/2002, à 10.30

    Qui?

    Raphael Sebbe

    Python interface to STRUT

    Quand?

    Le 19/04/2002, à 10.30

    Qui?

    Geoffrey Wilfart

    Le traitement d'images dans un environnement temps réel : la visionnique

    Quand?

    Le mercredi 12/12/2001, à 15:00

    Qui?

    P. REPJUK, Ir., Administrateur délégué de Capflow S.A.

    Quoi?

    La s.a. Capflow développe depuis 1995 un outil logiciel et matériel permettant le prototypage rapide d'applications visionniques temps réel. L'outil Visio Flex est constitué de cartes électroniques et de logiciels entièrement développés dans l'entreprise.

    • présentation brève de Capflow
    • exposé : les applications de la visionnique en milieu civil et industriel
    • présentation du concept VisioFlex (matériel et logiciel)
    • présentation des applications existantes construites avec l'outil Visio Flex
    • perspectives d'avenir

    Advantages of System On Programmable Chips (SoPC) for multimedia applications - Case Study : Motion JPEG

    Quand?

    Le mercredi 12/12/2001, à 14:00

    Qui?

    Olivier Cantineau, Ir, et L. Petit, Ir, Barco-Silex S.A.

    Quoi?

    Présentation d'une (des) technologie(s) du type SoPC (précisément un circuit programmable de type FPGA intégrant également un coeur processeur - exemple : Excalibur d'Altera, qui intègre un coeur ARM), afin d'en dégager les avantages dans le cadre d'applications multimédia, mais surtout de présenter un cas concret de codeur/décodeur Motion JPEG implémenté sur ce composant.
    Ce séminaire abordera - en dehors de l'application - les technologies très récentes de SoPC, les contraintes et les atouts d'un développement sur une telle plateforme - ce qui constitue un excellent exemple de développement conjoint hardware/software sur un seul chip.

    Automatic sleep-scoring software development

    When?

    Friday 30/11/01, 15:00

    Who?

    François Meers, MULTITEL

    What?

    This presentation will briefly review the problem of automatic sleep analysis. This automatization is wished to avoid tedious work to the technicians, and should provide the doctor with the hypnogram of the night (that is, the evolution of sleep stages along the night). The existing systems still lack of reliability and robustness, and this presentation will try to assess the usefulness of state-of-the-art signal processing and classification techniques to improve the classification performances.

    Nouveaux moyens d'acces au WEB

    Quand?

    Le mercredi 14/11/2001, à 15:00

    Qui?

    S. Lecomte; Maître de Conférence, Université de Valenciennes
    Sylvain Lecomte est Maître de Conférences à l'Université de Valenciennes et est co-responsable de l'organisation du DESS en Technologies Nouvelles des Systèmes d'Information.

    Quoi?

    Le marché des ordinateurs individuels (de type PC) a un plafond estimé à 100 millions d 'utilisateurs. A l'inverse de nouveaux moyens d'accès au WEB sont en plein developpement. On peut notamment citer :

    • le Marché mondiale PDA (20 Millions d 'utilisateurs en 2001 dans le monde, 80 Millions en 2008)
    • le Marché mondiale Téléphone mobile (20 Millions d 'utilisateurs en 2000 en France,500 à 1300 Millions dans le monde en 2004 (d 'après Cahners In-Stat Group))
    • le Marché de la télévision interactive (la télévision numérique devient le support obligé à partir de 2004)
    Cet exposé présente ces différents supports (contrainte, capacité et technologie)

    Introduction au Streaming

    Quand?

    Le mercredi 14/11/2001, à 14:00

    Qui?

    J. Hanoteau, Ir, chercheur, unité streaming, MULTITEL ASBL

    Quoi?

    • Les bases du Streaming : défis, solutions, techniques de compression, étude comparative des produits, étude de marché, perspectives d'évolution et démonstrations.
    • SMIL le langage du Multimédia sur Internet

    Feuille de soins informatisée, archivage, dossier médical & paramédical - Aspects techniques, légaux et éthiques, introduction à la télémédecine

    Quand?

    Le mercredi 7/11/2001, à 14:00

    Qui?

    E. Stanus, Dr Ir, Chef de groupe, MULTITEL ASBL
    Etienne Stanus était adjoint au directeur gestionnaire de l'hôpital Erasme jusqu'en janvier 2001; il est maintenant chef de groupe chez Multitel. Il est également membre de la commission "Normes en matière de Télématique au service du secteur des Soins de Santé" (Ministère des Affaires Sociales, de la Santé Publique et de l'Environnement Administration des Soins de Santé)

    Quoi?

    Aspects informatiques : normes de juré et de facto, ébauche de mise en pratique
    Dossier patient : aspects légaux, contraintes INAMI, aspects éthiques
    Aperçu de ce qui existe en télémédecine et des problèmes inhérents à ce type de pratique.

    Acquisition et traitement des signaux classiques de 1 à n dimensions - Introduction aux normes de sécurité et FDA

    Quand?

    Le mercredi 7/11/2001, à 14:00

    Qui?

    E. Stanus, Dr Ir, Chef de groupe, MULTITEL ASBL
    Etienne Stanus était adjoint au directeur gestionnaire de l'hôpital Erasme jusqu'en janvier 2001; il est maintenant chef de groupe chez Multitel. Il est également membre de la commission "Normes en matière de Télématique au service du secteur des Soins de Santé" (Ministère des Affaires Sociales, de la Santé Publique et de l'Environnement Administration des Soins de Santé)

    Quoi?

    Aperçu des techniques d'acquisition et de traitement des signaux les plus courants :

    • Électrophysiologie
    • EEG
    • EMG magnétoencéphalographie
    • cartographie de surface
    • ECG
    • vectocardiographie
    • Détection des ronflements et sybillances
    • Mesures d'audition, ...
    • Impédancemétrie: application en pneumologie
    • Imagerie médicale : imageurs RX, nucléaires, MR

    A préciser

    Quand?

    Le mercredi 17/10/2001, à 15:00

    Qui?

    D. Voituron, Ir, Administrateur-Délégué de B-Mind, S.A, BMIND S.A.

    Quoi?

    A préciser

    Les technologies vocales : présentation et applications

    Quand?

    Le mercredi 17/10/2001, à 14:00

    Qui?

    F. Bataille, Ir, Directeur technique, BABEL TECHNOLOGIES S.A.

    Quoi?

    Babel Technologies est un fournisseur de technologies dans le domaine du traitement de la parole. Les algorithmes qui ont été développés permettent l'intégration dans n'importe quelle application :

    • de la reconnaissance de la parole (Automatique Speech Recognition ASR)
    • de la synthèse de la parole (Text To Speech TTS)
    • de la vérification du locuteur

    Un court résumé des technologies existantes sera suivi d'une présentation plus approfondie de celles utilisées par Babel Technologies.
    Ensuite, différents types d'applications utilisant ces technologies seront présentés.

    MULTITEL-TCTS Seminar : Robust Automatic Speech Recognition in Reverberant Environments by Model Selection

    When?

    Friday, April 25th, 2001, 12:00 AM

    Who?

    Laurent Couvreur, Multitel

    What?

    This paper presents a method for robust automatic speech recognition (ASR) in reverberant environments. Our approach consists in the selection during operation of an acoustic model out of a library of models trained in various reverberant conditions. The best model is selected by blindly estimating the full-band reverberation time. The estimation procedure is entirely based on the short-term log-energy sequence of the utterance to be recognized. Speech recognition experiments in simulated and real reverberant environments show the efficiency of our approach which outperforms standard channel normalization techniques.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle de réunion (2nd floor)
    Avenue Copernic, B-7000 MONS (see directions)

    MULTITEL-TCTS Seminar : Introduction to Reinforcement Learning and dialogue systems applications

    When?

    Friday, March 30th, 2001, 3:30 PM

    Who?

    Olivier Pietquin, TCTS Lab

    What?

    The reinforcement learning problem is defined as learning how to map actions to situations by interacting with an environement so as to maximize a numerical reward. In the most challenging tasks, actions may affect not only the immediate reward but the next situation and, through that, all the following rewards. Trial and error search and delayed rewards are the most important distinguishing features of reinforcement learning.
    Reinfiorcement learning is different from supervised learning because the learning agent interracts directly with its environment to learn and it doesn't need any examples provided by some knowledgable external supervisor. Another main key feature of reinforcement learning is that it explicitly considers the whole problem of a goal-directed agent interacting with an uncertain environment and does not define sub goals without addressing how they might fit into a larger picture. Reinforcement learning problem may be formally specified in terms of optimal control of Markov decision processes.
    Dialogue system strategies may also be expressed as Markov decision processes (in terms of states and actions) and the problem of finding optimal policies can be solved by using reinforcement learning algorithms. In order to simulate interractions with the envirronment, user modeling may be used to reduce the real human-machine interractions.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle de réunion (2nd floor)
    Avenue Copernic, B-7000 MONS (see directions)

    MULTITEL-TCTS Seminar : Prosody Reception in Aphasia -- An Approach Toward Diagnostics with Speech Synthesis

    When?

    Tuesday Jan 23rd, 2001, 11AM

    Who?

    Vivian Gramley, Ph. D. Student, University of Bielefeld (dir.: D. Gibbon)

    What?

    I will talk about receptive dysprosody in aphasic patients. Aphasic patients do not only have problems understanding words and producing them but they also have difficulties comprehending prosody and its cues. There do not exist any measures which help diagnose these deficits. I am therefore developing a test which will explore which prosodic cues (duration, amplitude, fundamental frequency) aphasics cannot understand. The test sentences I use will be modified in such a way that the focus of individual words is changed by a modification in the durational pattern, the fundamental frequency, and the amplitude.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle de réunion (2nd floor)
    Avenue Copernic, B-7000 MONS (see directions)

    MULTITEL-TCTS Seminar : Bio-inspired methods for automatic recognition of complex auditory signals

    When?

    Thursday Dec 7th, 2000, 3PM

    Who?

    Pierre-Edouard Sottas, EPFL, Switzerland

    What?

    In response to complex signals, the peripheral auditory system accomplishes a non-trivial mapping between an aerial sound wave into a neural code. The spike trains resulting from this preprocessing are then transmitted to higher auditory centers where highly recurrent processing takes place. This two-step biological mechanism will serve as a framework for machine speech recognition. First, the auditory periphery is modelled as a bank of nonlinear time-varying parallel filters which includes an active and distributed feedback based on physiological evidence from human outer hair cells functioning. The patterns resulting from this bio-inspired feature extraction process were then used as an input to traditional speech recognition tools based on Hidden Markov Models. Recognition performance of such a preprocessing is competitive with traditional methods for performing phone probability estimation and shows a high power of information reduction. Finally, the process of recognition itself can be improved by the use of "diffusion networks", a model sharing the properties of both Hidden Markov Models and recurrent neural networks.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
    Avenue Copernic, B-7000 MONS (see directions)

    MULTITEL-TCTS Seminar : Digital communications using chaos

    When?

    Thursday Dec 7th, 2000, 4PM

    Who?

    Martin Hasler, EPFL, Switzerland

    What?

    The various methods to transmit digital data on a chaotic carrier signal are explained and the role of chaos synchronization is elucidated. Then the classical problem of analyzing the performance of such a communication system in the presence of channel noise is posed and performance figures for simple systems are given and compared with those of classical modulation methods. The ideal chaotic receiver is derived in a simple case, its exponential complexity in the transmitted signal length per bit is shown and efficient suboptimal methods of decoding are mentioned.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
    Avenue Copernic, B-7000 MONS (see directions)

    MULTITEL-TCTS Seminar : Représentation de données statistiques complexes à l'aide du son et du 3D

    When?

    Nov 28th, 2000, 3PM

    Who?

    M. Noirhomme-Fraiture

    What?

    Représentation de données statistiques complexes à l'aide du son et du 3D (en relation avec le projet ISO-3D)

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
    Avenue Copernic, B-7000 MONS (see directions)

    MULTITEL-TCTS Seminar : Issues in Concatenative Speech Synthesis

    When?

    Nov 21th, 2000, 2PM

    Who?

    B. Bozkurt

    What?

    In concatenation based speech synthesizers, the most important problem is the proper fusion of units to achieve intelligible and natural sounding synthetic speech. For that purpose, speech units need to be processed and concatenated so that mismatches at boundaries are reduced and target prosody features are imposed on synthetic speech with low segment concatenation artifacts. Currently, there are plenty of techniques used by researchers to perform these operations. In this small presentation, mainly application of TD-PSOLA(Time domain overlap add), MBROLA(MBE Resynthesis overlap add) and HNM (Harmonic-Noise Model) on concatenation problem will be considered for discussion. Main concentration will be on problems in MBROLA synthesis and how to improve our synthesis technique. This presentation is rather a problem statement and discussion on possible solutions of the problem than reporting the results of a study.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis, Salle des Séminaires
    Avenue Copernic, B-7000 MONS (see directions)

    Joint SPHEAR -- RESPITE meeting

    When?

    Sept 15-17, 2000

    Who?

    Members of the RESPITE Project

    What?

    see here for more info

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis
    Avenue Copernic, B-7000 MONS

    Confidence Measures in HMM/MLP Hybrid Speech Recognition for Turkish

    When?

    Aug 31st, 2000, 10:30 AM

    Who?

    Erhan Mengusoglu, FPMs, TCTS Lab

    What?

    Confidence Measures in HMM/MLP Hybrid Speech Recognition for Turkish Language.

    Confidence Measure is defined as "posterior probability of word correctness given the values of some set of confidence indicators". Some confidence measures will be presented.

    Turkish language is an inflected language. It is possible to produce a very high number of words from the same root with suffixes. Some possible language modelling techniques will be presented for Turkish Language.

    Preparation of a small database for turkish language will be presented. (DUREE: 30' + QUESTIONS)

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis
    Avenue Copernic, B-7000 MONS

    TCTS group meeting: Where are we now, and where do we go?

    When?

    Feb. 14th, 2000, 9:30 AM

    Who?

    O. Deroo, A. Ruelle, T. Dutoit, FPMs, TCTS Lab

    What?

    This is our yearly meeting, where we focus on past, current, and future projects for each research and development group: Speech Recognition, Man-Machine Interfaces, Speech Synthesis.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis
    Avenue Copernic, B-7000 MONS

    TCTS Seminar: Multi-microphone signal enhancement

    When?

    December 21st, 1999

    Who?

    Simon Doclo, KULeuven, ESAT Laboratory

    What?

    In many speech communication applications, like audio-conferencing and hands-free mobile telephony, the recorded speech signals contain a considerable amount of acoustic noise. Background noise causes a signal degradation which can lead to total unintelligibility of the speech and which decreases the performance of speech coding and recognition systems. In this talk we will discuss some multi-microphone signal enhancement techniques for noise reduction. In the first part of the talk standard fixed and adaptive beamforming techniques will be discussed. The second part of the talk will focus on a GSVD-based optimal filtering technique, which has a better noise reduction performance and which is more robust than standard beamforming techniques.

    Where?

    Faculté Polytechnique de Mons, MULTITEL-TCTS Lab, Parc Initialis
    Avenue Copernic, B-7000 MONS

    ALIF Kick-off meeting

    When?

    February 24 & 25nd, 1999

    What?

    First meeting for the INCO-DC ALIF project, officially started on Jan 1st, 1999.
    The goal is to re-examine the technical annex of the project, in the light of recent developments in TTS synthesis. A new timetable will be established, for the years 1999-2000.

    Participants: TTS Team of TCTS Lab, IRSIT, OAPAM, UNAT, TANIT, TELMAT, (EPFL).

    Where?

    Faculté Polytechnique de Mons (Salle d'Automatique: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    MBROLA meeting

    When?

    October 2nd, 1998

    What?

    1. What does it take to build an MBROLA synthesizer in any given language?
      • technical: hardware, preparation, time, expertise
      • linguistic: problems of vowel stress and tone
    2. What can be done with other MBROLA tools to build/exploit other language resources in that language, once the synthesizer has been created?
    3. What next?
      • adding languages: Swahili, Baule, Hausa, ...?
      • is a full-IPA synthesizer realizable? sensible?

    Participants: TTS Team of TCTS Lab, Didier Demolin and his group, Daffyd Gibbon (Univ. Bielefeld), Peter Ladefoged (UCLA). See photos of the meeting.

    Where?

    Université Libre de Bruxelles, Institut des Langues Vivantes et de Phonétique
    Campus du Solbosch

    SPRACH/THISL Review Meetings (internal)

    When?

    March 24 & 25, 1998

    What?

    Simultaneous review meetings for two ESPRIT research projects coordinated by the Faculté Polytechnique de Mons: SPRACH (SPeech Recognition Algorithms for Connectionist Hybrids, ESPRIT Long Term Research RTD Project Ref. 20077) and THISL (Thematic Indexing of Spoken Language, ESPRIT Long Term Research RTD Project Ref. 23495.). Presentation of work programmes and advances. Discussions with partners and reviewers. See the agendas.

    Where?

    Faculté Polytechnique de Mons (Salle Macquet: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    Festival Speech Synthesis System

    When?

    February, 27th, 1998 (10 AM - 11 AM)

    What?

    Anne Gilman (MULTITEL) gives a walkthrough of FESTIVAL, a highly versatile, multilingual speech synthesis system. She analyses the data structures and tools it uses and draws conclusions on its potential interest for speech science. The talk is in English.

    Where?

    Faculté Polytechnique de Mons (Salle de cours de Théorie des Circuits: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    Quantum Computers

    When?

    February, 20th, 1998 (2 PM - 3:30 PM)

    What?

    Video of a talk given by Nobel Prize winner Richard Feynman at Bell Labs, in 1985.

    "I would like to describe a field, in which little has been done, but in which an enormous amount can be done in principle. This field is not quite the same as the others in that it will not tell us much of fundamental physics (in the sense of, ``What are the strange particles?'') but it is more like solid-state physics in the sense that it might tell us much of great interest about the strange phenomena that occur in complex situations. Furthermore, a point that is most important is that it would have an enormous number of technical applications.

    What I want to talk about is the problem of manipulating and controlling things on a small scale. Why cannot we write the entire 24 volumes of the Encyclopedia Brittanica on the head of a pin?"

    Where?

    Faculté Polytechnique de Mons (Salle de cours de Théorie des Circuits: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    Plug and Play Software for Designing High-Level Speech Processing Systems

    When?

    January, 30th, 1998 (10 AM - 11 AM)

    What?

    Talk given by T. Dutoit (in French)

    PnP software is a simple and efficient way of using object oriented languages (and more specifically C++) as an extension to function-based programming for high-level processes. This programming paradigm mimics the inclusion and abstraction properties of block-diagrams by allowing processes to be included into higher-level processes and by describing each process at three different levels of abstraction. It is based on a stream-like class hierarchy to be used as IOs for the abovementioned processes.

    Where?

    Faculté Polytechnique de Mons (Salle de cours de Théorie des Circuits: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    Transmission et codage d'images numériques

    When?

    December, 16th, 1997 (2 PM - 5 PM)

    What?

    Talks on image coding and transmission by researchers of the Université de Valenciennes et du Hainaut Cambrésis, OAE Lab (in French)

    F.X. Coudoux
    - Amelioration de la qualité des images decodees
    L. Grimbert, P.Corlay
    - Transmission de sequences MPEG2 sur ATM
    M.Colin, M.Gharbi
    - Transmission ADSL

    Where?

    Faculté Polytechnique de Mons (Salle de cours de Théorie des Circuits: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    Reconnaissance et codage d'images numériques

    When?

    December, 15th, 1997 (2 PM - 5 PM)

    What?

    Talks on image coding and recognition by researchers of the Ecole Royale Militaire, Brussels (in French)

    M. Acheroy
    - ?

    Where?

    Faculté Polytechnique de Mons (Salle de cours de Théorie des Circuits: 3 on the map)
    31 Bvd Dolez B-7000 MONS

    Journées d'Etudes sur la Parole

    When?

    November 3rd, 1997 (9 AM - 5 PM)

    What?

    A series of talks by specialists in Speech Processing (in French)

    Nicolas Moreau
    (ENST, Paris) - Compression de sources sonores
    Daniel Hirst
    (Université d'Aix-en-Provence) - Traitement du langage naturel
    Thierry Dutoit
    (Faculté Polytechnique de Mons) - Synthèse de la parole
    Hervé Bourlard
    (IDIAP, Suisse) - Reconnaissance automatique de la parole

    Where?

    Faculté Polytechnique de Mons (Salle Académique: 3 on the map)
    31 Bvd Dolez B-7000 MONS


^ Top ^