Ensemble d'API en Java + dictionnaire (format relationnel) + compilateur (java) + outil de gestion de dictionnaire (Java ou Dos)
Le entrées du Sémiographe sont des mots, ses sorties sont des mots-sens, des couples de mots-sens, des scores de mots-sens...
Les API du Sémiographe sont simples ou composées d'autres API du Sémiographe. De très nombreux paramétrages et applications sont possibles :
API simple :
- production de différentes forment de dérivation
- production de synonymes
- production de génériques
- production de spécifiques
- production de lieux inclus
...
- production de traduction
...
API utilisant d'autres API sur un tableau noir nommé : PHRASE, qui est capable de contenir toute information et annotation d'un texte de longueur n (dans la limite de la mémoire) pour chaque mot ou grain de celui-ci.
- Polysémie
- Détermination du sens d'un mot en contexte
- Calcul du sens spécifique d'un terme en contexte
- Calcul d'un choix d'une traduction.
- Résumé de texte
- Détermination des mots-clés importants d'un texte du point de vue thématique
- Assistance à la lecture des textes par la lecture transversale des mots-clés extraits par calcul d'un texte ; outil d'extraction d'informations.
- Pondération des indexations de base (par le calcul de la polysémie, et des résumés)
- Diffusion sélective d'informations/routage
- Indexation d'un texte sur n autres textes, ces n autres textes formant une nomenclature, une liste d'intérêts, ...
- Classement de documents
- Accès à des nomenclatures établies
- Modélisation d'un domaine dans le cadre de la langue générale...
...
Le schéma fonctionnel des applications est souvent simple et comprend peu d'algorithmes spécifiques : il est proche de la simplicité d'un batch de commandes.
Pour le français, la version actuelle du Sémiographe gère 185.000 mots-sens. |
|