Site en français

Projet Sypole

Logo Sypole

Taille du texte de la page : Normal | Grand | Très grand


  • Accueil
  • Traitements d'images
    • Billets de banque
    • Reconnaissance d'objet
    • Reconnaissance de texte
    • Reconnaissance de couleurs
    • Apprentissage à la prise de photos
  • Communications et médias
    • Lecteur de livre DAISY
    • Lecteur de journaux
    • GSM - Assistant personnel
  • Ergonomie
    • Interface
    • Video-agrandissement
  • Informations
    • Contact
    • Publications
    • Revues de presse
    • Liens

Reconnaissance de texte

Descriptif :

La lecture de texte est une action devenue presque réflexe mais pour les personnes déficientes visuelles, la réalité est bien différente. Comment lire son courrier, son journal, les publicités, les numéros et noms des rues, les noms de produits alimentaires? Pour ajouter un peu plus de confort au quotidien, Sypole propose une application de lecture de texte dans un appareil grand public (type PDA), facile à transporter et dont l’ergonomie a été travaillée. Les solutions actuelles pour les personnes malvoyantes est d’utiliser une machine à lire pour agrandir le texte, rendre le contraste plus fort (comme le proposed’ailleurs notre application « loupe grossissante » de Sypole) et pour les personnes aveugles de se faire aider par une tierce personne ou de ne profiter que des inscriptions en Braille dans le cas de la connaissance de ce langage. Ainsi, il est aisé de comprendre ce que peut apporter Sypole aux personnes déficientes visuelles. Quelques exemples de scènes sont illustrés ci-dessous pour apprécier le challenge de cette application :

Exemple de texte 1Exemple de texte 2

Comme nous avons souhaité développer une solution tout incluse avec appareils grand public, l’appareil photo, en Europe, intégré dans le PDA n’a une résolution que de 1.3Mégapixels. Ainsi nous devons suivre l’évolution du marché en proposant des solutions toujours plus efficaces.

Fonctionnement :

Depuis le menu principal de Sypole, l’utilisateur est guidé par un message sonore vers le menu « Caméra » pour effectuer une prise de vue. Dans ce dernier menu, toutes les applications nécessitent une photo. Après être rentré dans le menu « Lecture de texte » et des indications sur la prise de photo elle-même, l’utilisateur peut prendre une photo et attendre la lecture de la partie textuelle de l’image. Mais comment prendre une « bonne photo », avec une bonne illumination, un bon focus? Cette question peut être résolue grâce à notre application « Entraînement à la visée » au moyen d’une mire. L’utilisateur s’entraîne à la maison à prendre des photos bien cadrée de mire afin d’acquérir quelques réflexes et notamment appréhender l’appareil.

Détails techniques :

La détection du texte dans une image est une étape délicate et est caractérisée dans notre application par l’énergie de contours multidirectionnels, propre au texte. Plusieurs règles sont ensuite énoncées pour retirer les parties non textuelles. L’extraction est une partie prépondérante. En effet, si son résultat est de piètre qualité, il sera très difficile d’obtenir de bons résultats de reconnaissance. Nous utilisons une information en niveaux de gris pour le texte sur fonds uniforme et couleur pour le texte de scènes naturelles, à fonds complexes et pouvant comporter de fortes dégradations notamment dues à l’illumination. La segmentation en caractères individuels est une étape clé pour la reconnaissance que nous utilisons, basée sur des composants connexes.

Enfin, la reconnaissance et la correction fonctionne de paire pour fournir du texte corrigé appartenant à un dictionnaire, afin de limiter les erreurs de reconnaissance et donc les réponses vocales incompréhensibles.

Pour de plus amples détails, consultez notre page des publications ou notre vidéo.


logo de la Région wallonne
FPMs - TCTS 2006 - Tous droits réservés.

Valid XHTML 1.0 Strict