Portail des technologies de la langue

00000001.jpg

CHERCHER

Accueil

Contact

Technologies de la Langue

Introduction au domaine

Enjeux & Limites

Chiffres cl�s

Études de cas & Visites d’entreprises

Panorama

Les acteurs du domaine

Formations et m�tiers

Th�ses

Ressources et outils

Initiatives nationales & europ�ennes

Action Technolangue

Pr�sentation

Th�mes

Projets

Normes & Standard

Enjeux

Instances

Imprimer cet article

Traduction automatique

mardi 10 octobre 2006

Un syst�me de traduction automatique par ordinateur (TAO) permet de traduire un document original en langue source en un document traduite en langue cible.

On distingue plusieurs types de TAO :

La TAO du veilleur permet de traduire automatiquement et rapidement de grands volume de documents, la traduction est grossi�re, mais la qualit� n’est pas essentielle car il s’agit de faire de l’acquisition d’informations. Les syst�mes disponibles gratuitement sur le web sont de ce type.
La TAO du r�viseur permet de produire des traductions dont la qualit� est suffisante pour que l’utilisateur puisse post-�diter (r�viser) le texe cible afin d’obtenir une traduction diffusable. Ce sont des syst�mes "sur mesure" pour des utilisateurs et des typologies de documents donn�s. Lorsque le domaine et le type des documents � traduire, la r�vision peut m�me �tre l’exception. C’est le cas, par exemple, pour le syst�me METEO qui traduit des bulletins m�t�orologiques au Canada.
La TAO du traducteur offre, � des traducteurs humains, un ensemble d’outils (dictionnaires bilingues, bases terminologiques, thesaurus de bitextes), accessibles depuis un traitement de texte, afin de les assister dans leurs t�ches quotidiennes. Il s’agit ici de traduction humaine assist�e par la machine.

Les diff�rents traitement linguistiques mis en �uvre dans un syst�me de TAO permettent de d�finir l’architecture linguicielle du syst�me. Pour simplifier, on distingue en g�n�ral trois �tapes de traitement : l’analyse, le transfert et la g�n�ration. Ces �tapes utilisent des grammaires de transformation (cha�ne vers arbre, arbre vers arbre, arbre vers cha�ne) et des dictionnaires monolingues ou bilingues.

L’analyse calcule une structure interm�diaire plus ou moins profonde (plus ou moins abstraite, s�mantique) des �nonc�s en langue source.
Le transfert calcule une structure interm�diaire �quivalente � un niveau d’abstraction proche de celui qui a �t� calcul� en langue cible. Il s’agit, par exemple, de remplacer les mots de la langue source par les mots de la langue cible et de r�organiser la structure.
La g�n�ration calcule un texte en langue cible � partir de la repr�sentation interm�diaire en langue cible.

Si l’�tape d’analyse permet d’obtenir une repr�sentation s�mantique abstraite de l’�nonc� � traduire, il n’y a pas d’�tape de transfert, mais directement une �tape de g�n�ration. On parle dans ce cas de tradcution par pivot. Inversement, si l’�tape d’analyse est tr�s r�duite (recherche des formes du dictionnaire des mots du texte), l’�tape de transfert fait tout le travail, et il n’y a pas de g�n�ration. On parle alors de traduction directe (ou de syst�me de premi�re g�n�ration). Dans les autres cas on parle de traduction par transfert (ou de syst�me de seconde g�n�ration).

Il existe aussi des syst�mes de traduction qui utilisent des approches fond�es sur les donn�es : les syst�mes � m�moire de traduction et les syst�mes statistiques. Le c�ur d’un syst�me � m�moire de traduction est une base de donn�es dans laquelle chaque segment d�j� traduit est repr�sent� par sa repr�sentation en langue source et sa repr�sentation en langue cible. La repr�sentation peut �tre plus ou moins complexe allant d’une simple cha�ne de caract�res � une repr�sentation utilisant plusieurs niveaux de repr�sentation linguistique. Traduire un nouveau segment S signifie chercher une combinaison de segments, ou sous-segments, de la base de donn�es qui se rapproche le plus de S. Les traductions des segments ou sous-segments choisis sont combin�es pour produire une traduction de S en langue cible.

Avec un syst�me de traduction statistique, on consid�re la traduction comme un probl�me de d�codage. Le mod�le de base utilise deux sources de connaissances statistiques d�finies par des distributions de probabilit�s calculables s�par�ment :

un mod�le de traduction Pr(s|c) qui n�cessite de d�finir une correspondance entre les mots de la phrase cible c et les mots de la phrase source s.
un mod�le de langage de la langue cible Pr(c) qui d�finit la bonne formation d’une suite de mots en langue cible c.

L’�tape de traduction proprement dite est une �tape de d�codage (de recherche) qui cherche � maximiser le produit Pr(c).Pr(s|c) pour l’ensemble des phrases cibles c connaissant la phrase source s.

Herv� Blanchon