Papins est un prototype d'analyse pour la production d'index sémantiques à partir de textes qui relatent les activités de recherche des agents de la DER-EDF. Le projet dans le cadre duquel a été développé ce prototype a été appliqué à un corpus de 200 comptes-rendus d'activité de recherche scientifique (ARD). L'extraction de connaissances s'est réalisée selon trois niveaux d'analyse distincts : le niveau pragmatique (organisation globale des textes, thématiques), le niveau linguistique (représentation des fragments de phrases extraits au niveau précédent par des structures prédicat-arguments) et le niveau conceptuel (comment les structures prédicat-arguments peuvent se réécrire de façon automatique en des structures conceptuelles de type LCS (Lexical Conceptual Structure de Jackendoff ?). Dans Papins seuls les deux premiers niveaux sont implémentés. |
|