ANAGRAM est constitué d'un ensemble d'analyseurs indépendants, chacun d'eux étant dédié à l'étude d'un type de données.
Bien que opérant sur du langage naturel, ANAGRAM ne traite qu'une petite partie des problèmes du traitement automatique de la langue naturelle. Il a été possible de minimiser les problèmes d'analyse syntaxique, par contre le problème de la polysémie lexicale de l'utilisateur reste un réel problème et pourtant la résolution de ce problème est essentielle pour que l'interrogation soit conviviale.
L'interrogation, au travers de l'Anté-Serveur, de banques de données documentaires, s'effectue par l'intermédiaire d'un masque de saisie. Ainsi l'utilisateur n'aura pas tendance à exprimer sa demande sous forme de phrases complexes, comme par exemple : "je cherche des documents sur les industries productrices de composants chimiques pour les produits médicaux". Au contraire l'utilisateur sera plus concis dans sa demande, en utilisant des expressions simples. Chacun des champs composant ce masque correspond à une rubrique conceptuelle, c'est-à-dire à un type particulier d'information, (THÈME, DATE, AUTEUR, TITRE...). L'utilisateur doit pouvoir formuler sa demande en langage non contraint sur chacun de ces champs. Il s'agit là d'une formulation libre sur des champs typés. Le champ DATE doit autoriser la saisie d'expressions exprimées dans différents formats (en toutes lettres, en abrégé ou sous forme numérique) ; et le champ de type THÈME conduit aux énoncés les plus complexes, et offre donc une résistance linguistique plus importante.
L'analyse des énoncés sur chacune de ces rubriques va mettre en oeuvre des règles syntagmatiques et sémantiques différentes et donc nécessiter des analyseurs différents. ANAGRAM offre la possibilité d'associer un analyseur particulier à chacune des rubriques du masque de saisie. |
|