Elan propose une gamme de composants de synthèse de la parole à partir du texte en différentes langues.
L'interface à ces composants est une API permettant d'intégrer la fonction synthèse de la parole dans tout type d'application. De façon à rendre l'intégration immédiate et simple, Elan supporte le standard SAPI de Microsoft qui est supporté en standard par un nombre grandissant d'applications.
La synthèse de parole à partir du texte d'Elan est capable de lire à voix haute, avec une intonation très naturelle, tout texte ascii.
Conversion Orthographe vers phonétique
Le système de synthèse de parole fait une conversion orthographique vers la phonétique automatiquement à partir d'un ensemble de règles spécifique à chaque langue. Au cas où un mot, une exception ou une abréviation n'est pas prononcée correctement, l'utilisateur peut ajouter ses propres mots dans des lexiques d'exceptions ou d'abréviations. Il est également possible d'inclure directement dans le texte une chaîne phonétique qui sera prononcée telle quel .
Calcul de la prosodie
Une fois la chaîne phonétique obtenue, le système détermine une prosodie à appliquer au texte à lire. Ces paramètres prosodiques (durée, fréquence) sont attaché à chaque phonèmes.
Synthèse
Cette chaîne phonético-prosodique est envoyée au dernier élément du système de synthèse de parole qui va prendre chaque son élémentaire (diphones, transition entre 2 phonèmes) dans une base de donnée contenant tous les sons élémentaires de la langue et les concaténer en appliquant les consignes de durée et de fréquence. Ceci est effectué grâce à la technique PSOLA ' Pitch synchronous overlap add. ' breveté par France Télécom / C.N.E.T.
Le résultat est un flux audio, qui selon les produits, est envoyé directement sur une carte audio (type Soundblaster) ou vers un fichier ou tout autre interface de restitution (Téléphonie, Automobile..)
La voix du système de synthèse de parole est basé sur un locuteur qui a été enregistré, dont la voix a été segmentée et stocké dans une base de donnée propre au système de synthèse.
Elan dispose généralement de voix féminine et masculine pour chaque langue.
Elan peut développer une voix sur mesure à partir d'un locuteur.
Le système de synthèse de parole permet de jouer sur la vitesse et le pitch (la tonalité) de chaque voix. |
|