Typologie : Génération de textes Catégorie : Outil Langues : Organisme : Description : Le générateur CRISTAL existe en deux versions : une version "classique" et une version "noyau" distinguant les éléments indispensables du générateur (sans lesquels la génération devient impossible) de ceux liés à l'utilisateur et à l'application concernée. Toutefois, le modèle linguistique est le même dans les deux versions et les architectures informatiques des deux systèmes très proches.
Le point de départ de ce système est une représentation formelle du contenu sémantique du texte à produire. Plusieurs types de représentation formelle ont déjà été testés , comme par exemple les prédicats ou les graphes conceptuels.
Le système de génération est basé sur un modèle linguistique prenant en compte plusieurs opérations (ou phénomènes) linguistiques. Ces opérations mettent en jeu une ou deux propositions élémentaires (composées d'un verbe et de ses compléments régis).
Certaines opérations peuvent être imposées au départ par l'application, en fonction de l'utilisateur ou selon le contenu à exprimer (pour la négation, par exemple). D'autres opérations seront calculées au fur et à mesure du traitement, à partir de la représentation formelle du contenu du texte
Les opérations linguistiques concernées par ce système sont principalement la coordination (par 'et...) et l'anaphorisation (par utilisation de pronoms personnels) ; les thématisations ont également été en partie étudiées.
Tous les éléments concernant l'application ou l'utilisateur sont exclus du traitement des opérations linguistiques, laissant au seul modèle linguistique la capacité de choisir et d'exécuter une opération. Les informations sur l'application et le destinataire sont utilisées en filtre des solutions proposées. Le modèle linguistique utilise des règles, d'abord de détections pour chercher les opérations linguistiques possibles en fonction du contenu, puis des règles de compatibilité pour associer certaines opérations linguistiques entre elles, enfin des règles de grammaire pour la mise en oeuvre effective des opérations linguistiques.
L'objectif de ce système est de fournir différentes versions pour un même contenu de départ, en variant les opérations linguistiques contenues dans ces versions. Pour chaque opération linguistique potentielle, l'on tente de la combiner avec d'autres opérations linguistiques, tout en vérifiant que les aspects grammaticaux soient exacts, et en privilégiant le contenu informationnel du texte (aucune ambiguïté ne doit être créée).
D'un point de vue informatique, on distingue les aspects directement liés à la planification du texte (l'organisation du texte et des opérations linguistiques qui vont être utilisées), et ceux liés à l'étape de réalisation : l'écriture proprement dite du texte.
Les deux versions du générateur fonctionnent avec une architecture informatique identique. Les seules différences entre les deux appartiennent au système noyau et sont, d'une part l'ajout d'un module de lexicalisation distinct du générateur et beaucoup plus développé que dans la première version, et d'autre part, un module de paramétrage qui guide la génération tout au long du processus, permettant une meilleure adaptation à l'application et au destinataire du texte.
Il est enfin à signaler que le générateur contient un générateur morphologique, utilisé dans plusieurs applications dont un contrat européen, et qui peut aussi être employé indépendamment, pour obtenir la forme fléchie d'un nom ou adjectif, ou la forme conjuguée d'un verbe. |
|