Typologie : Correcteur orthographique / lexical Catégorie : Outil Langues : Organisme : IRIT Description : Le correcteur lexical VORTEX permet de corriger les fautes d'usage et les fautes typographiques en se fondant sur un modèle stochastique. Le système utilise un lexique orthographique extrait de BDLEX-1 où les entrées lexicales ont été découpées automatiquement en groupes de difficulté orthographique (gpo) d'après leur représentation en phonogrammes. Ce découpage s'effectue à l'aide de règles de transcription phonogrammes-gpos. L'IRIT a défini 530 gpo à partir des 350 phonogrammes recensés.
* La version VortexLem, dérivée de VORTEX, est un lemmatiseur tolérant : elle permet d'effectuer l'analyse morphologique d'un texte éventuellement entaché de fautes. Ce système utilise un lexique orthographique augmenté d'informations morphosyntaxiques. Il peut ainsi associer à chaque mot d'un texte ses différentes interprétations.
Ce linguisticiel a été utilisé pour l'analyse du corpus de textes BREF.
* Enfin, le système VortexPlus est un environnement pour la correction grammaticale. Il intègre :
- le système VortexLem pour l'analyse morphologique et la correction lexicale,
- le système ASSP pour l'analyse syntaxique de texte et la détection des fautes syntaxiques,
- le système GENER pour produire les graphies des corrections des fautes d'accord,
- ainsi qu'un module supplémentaire qui se charge d'appliquer les stratégies de correction. |
|