Typologie : Bases de données lexicales Catégorie : Ressource Langues : Organisme : Université de Caen - ELSAP Description : * Aspect linguistique :
Ce dictionnaire des synonymes contient plus de 58 000 entrées ; pour l'obtenir, sept dictionnaires de synonymes (Bailly, Benac, du Chazeaud, Guizot, Lafaye, Larousse, et Robert) ont été fusionnés, puis la liste issue de cette fusion a été symétrisée.
Ces dictionnaires ont été fournis par l'INALF (Institut NAtional de la Langue Française).
Chaque entrée (aussi appelée vedette) du dictionnaire est suivie d'une liste de synonymes "brute" qui ne distingue ni les catégories ni les nuances de sens ; c'est en effet par un traitement informatique de cette liste que sont obtenus ce que l'on peut appeler les "sens élémentaires" du mot-vedette.
* Aspect informatique :
Le traitement informatique est simple dans son principe : on construit d'abord le graphe de la relation de synonymie entre les synonymes du mot-vedette, puis on recherche les sous-graphes complets de ce graphe ; ceux-ci (appelés "cliques" dans la théorie des graphes) donnent les sens élémentaires.
S'il n'y a qu'un seule clique dans le graphe (qui est par conséquent complet), on dit alors que le mot-vedette est monosémique.
De plus, si la fermeture transitive du graphe est calculée (si A est synonyme de B et B synonyme de C, alors A est synonyme de C), on obtient un nouveau graphe dont le nombre de cliques permet de dire si le mot-vedette est polysémique (une seule clique) ou homonymique (plusieurs cliques).
Le dictionnaire comprend :
- le fichier dictionnaire proprement dit (fichier texte tabulé)
- le fichier d'index du dictionnaire
- les scripts Perl de consultation
Sa consultation sur le Web est libre mais limité à 50 requêtes par jour et par machine
Son utilisation en local nécessite l'interpréteur Perl (outil public)
un outil complémentaire pour les chercheurs existe au laboratoire mais nécessite l'utilisation de la plate-forme logicielle Matlab.
* Consultation du dictionnaire
La consultation permet d'obtenir les synonymes d'un mot, éventuellement avec les cliques qui résultent de la relation de synonymie, et de savoir si la vedette est monosémique, polysémique ou encore homonymique. Attention, si le nombre de synonymes est élevé (plus de 100), le temps d'obtention des cliques devient assez long (le maximum étant de 45 s pour "beau" qui possède 200 synonymes et 545 cliques). |
|