Retour au format normal

Analyse morphologique dérivationnelle

10 octobre 2006

Technolangue.net

 

La morphologie dérivationnelle est la branche de la terminologie qui s’occupe de la formation de mots nouveaux à partir de mots existants, particulièrement via l’ajout de suffixes et préfixes. Ainsi, dans vendeur, le suffixe -eur s’adjoint à la base verbale pour créer un nom. Comme dans le cadre de l’analyse flexionnelle (cf. fiche lemmatisation), l’analyse dérivationnelle peut reposer sur l’emploi d’une base lexicale. CELEX (Burnage, 1990) est ainsi une vaste base pour l’Anglais, le Néerlandais et l’Allemand, qui fournit, pour chacune de ces langues, divers lexiques dont celui des lemmes contenant, pour chaque lemme, une information dérivationnelle à travers sa structure morphologique. Par exemple, la structure de celebration est ((celebrate [V]), (ion) ([N|V.])[N]), qui indique que celebration est un nom ([N]) et que l’ajout du suffixe -ion au verbe celebrate produit ce nom. Se basant sur le cadre théorique défini par D. Corbin (1987), le projet MorTAL a été proposé pour, entre autres, pallier l’absence d’une telle ressource pour le Français. Outre l’outil DéCor qui, sans connaissances linguistiques a priori, acquiert automatiquement des liens morphologiques entre des mots dans un lexique (TLFnome) à l’aide de l’outil Unix findaffix (Dal et al., 1999) (voir également la recherche de tels liens sur le Web dans (Tanguy et al., 2002)), ce projet MorTAL a donné lieu à la réalisation de l’analyseur dérivationnel automatique du Français DériF (Hathout et al., 2002). Cet analyseur est actuellement développé pour l’analyse morphologique et sémantique des suffixes -able, -ité, -et(te), -is(er), -ifi(er), -eur, -ment, -tion, et -oir, et des préfixes dé-, in-, re-, a- et en- dans certains contextes. Fondé sur des règles linguistiques, il calcule l’arbre d’analyse d’un mot entré avec son étiquette grammaticale et détermine l’opération sémantique induite par l’affixe appliqué en dernier, ce qui lui permet de fournir une glose du mot. DériF, récursif, calcule toute la famille d’un mot construit, et gère les éventuelles ambiguïtés. Ainsi, il fournit l’analyse suivante pour introuvable : ADJ ==> [ in [ [trouver VERBE] able ADJ] ADJ] (introuvable/ADJ, trouvable/ADJ, trouver/VERBE) : "non trouvable". Les résultats de DériF, évalués pour les deux suffixes -able et -ité par exemple, sont bons (86 % de bases correctement trouvées pour un ensemble de test de 2043 mots).

Références

-  Gavin Burnage. CELEX : A Guide for Users. Center for Lexical Information, University of Nijmegen, 1990. Danielle Corbin. Morphologie dérivationnelle et structuration du lexique. Thèse de doctorat d’État, Université Paris VIII, 1987 (également Tübingen, Max Niemeyer Verlag ; 2e éd., Villeneuve d’Ascq, PUL, 1991.)

-  Georgette Dal, Nabil Hathout, Fiammetta Namer. Construire un lexique dérivationnel : théorie et réalisations. Actes de TALN’99 (Traitement Automatique des Langues Naturelles), Cargèse, France, 1999. Nabil Hathout, Fiammetta Namer, Georgette Dal. An Experimental Constructional Database : The MorTAL Project. In Many Morphologies, P. Boucher ed., Cascadilla Press, Somerville, pages 178-209, 2002.

-  Ludovic Tanguy, Nabil Hathout. Webaffix : un outil d’acquisition morphologique dérivationnelle à partir du Web. Actes de TALN’02 (Traitement Automatique des Langues Naturelles), Nancy, France, 2002.

Voir aussi


-  www.ru.nl/celex
-  www.univ-lille3.fr/silex/mortal/

Béatrice Daille et Pascale Sébillot