Top » Directory

Informations
Presentation
Inscription
Contact Us
Directory
Private company
Research Organizations
Associations
Tools
Quick Find
 
Use keywords to find the product you are looking for.
Advanced Search
<<< TEXT_PAGE_PREC
TOOL_TIP_LISTE TOOL_TIP_PRINT
TEXT_PAGE_NEXT >>>
FIPSVox 1.0
Système de lecture automatique de texte en français
Identification
Typologie : Synthèse de la parole (à partir du texte) 
Catégorie : Produit/Logiciel Prototype 
Langues :
Organisme :
Description :
Le projet FipsVox (Gaudinat & Wehrli 1997) et (Gaudinat & Goldman 1998) vise à développer un système de synthèse de la parole à partir d'un texte (`text-to-speech system'). Ce qui le distingue de la plupart des autres systèmes de synthèse du français, c'est avant tout sa base linguistique, à savoir l'analyseur syntaxique (F)IPS. Ce projet comporte également des préoccupations d'ordre théorique, notamment celle de montrer l'importance des données linguistiques pour le traitement de la parole.
En effet, malgré les progrès considérables accomplis récemment en synthèse de la parole, les systèmes actuels présentent encore des lacunes importantes, principalement en ce qui concerne les aspects prosodiques (intonation, durée, etc.), mais également au niveau du traitement des homographes et de celui de la liaison. Ces lacunes, largement responsables du caractère peu naturel de la voix de synthèse, peuvent porter préjudice à la compréhension d'un énoncé et limitent donc considérablement les possibilités d'application pratique des systèmes de synthèse vocale.
C'est la phrase syntaxiquement analysée qui sert de point d'entrée à la composante graphème-phonème, chargée de transcrire la phrase en une séquence de signes phonétiques. Cette étape s'effectue grâce à une base de données phonétique dans laquelle sont répertoriées les formes phonétiques des mots de la langue (ou plus exactement du sous-ensemble de la langue connue par le système), ainsi que d'un système-expert chargé de dériver des séquences phonétiques plausibles pour les mots inconnus. Certains ajustements doivent ensuite être effectués sur les séquences phonétiques dérivées par les processus décrits ci-dessus. Il s'agit, entre autres, des phénomènes de liaison, de dénasalisation et d'élision du e-muet, qui obéissent tant à des contraintes lexicales que syntaxiques.
Toutes ces informations sont ensuite envoyées au synthétiseur MBROLA (développé par T. Dutoit à la Faculté Polytechnique de Mons) qui produit les signaux digitaux transmis au lecteur audio de la machine utilisée.
Nous tentons de dériver de l'analyse syntaxique détaillée, une structure prosodique arborescente qui contienne une estimation des frontières de groupes prosodiques. Le bon positionnement de ces derniers dans la phrase est primordiale en synthèse de la parole car ils déterminent la position des accents et des pauses. En plus de leur lien théorique avec la syntaxe, ils font appel à la notion d'eurythmie, c'est-à-dire d'un bon équilibre dans la phrase (en d'autres termes, on préférera prononcer une phrase dans laquelle les groupes prosodiques comportent à peu près le même nombre de syllabes, qu'une phrase dont la taille des groupes prosodiques est déséquilibrée).
Informations technique
Support : CD-Rom
FTP
On line
Type de machine : PC Intel (et compatible)
Station de travail Linux - VMS
Gros systèmes Linux - VMS
Système : Unix Linux
Windows 95/98 NT 3.5/4.0
Mémoire Minimum : 32 Mo
Mémoire recommandée : 64 Mo
Espace disque : 10 Mo
Intégration
Autonomie :
Disponibilité commerciale, technique et légale
Documentation en ligne :
Documentation en français :
Utilisateurs potentiels : Utilisateur final, Intégrateur, Recherche,
Contact
Mr Arnaud Gaudinat
Ingénieur en informatique industrielle et Intellig
Email : gaudinatlatl.unige.ch
Fax : (22) 705 79 31
Téléphone : (22) 705 72 74
Created date : 2005-02-25 12:57:58