Logiciel de traduction

Le moteur de traduction hybride SYSTRAN

Un nouveau moteur de traduction hybride

Le moteur de traduction hybride mis au point par SYSTRAN combine les qualités de la technologie à base de règles ("rule-based") et du traitement "statistique". Les règles linguistiques et les dictionnaires, généralistes et spécialisés, garantissent des traductions fidèles à la langue de l'entreprise. Ils assurent le respect de la terminologie métier et une bonne qualité de traduction, même sans personnalisation du logiciel. Les nouveaux composants statistiques permettent l'apprentissage automatique et rapide à partir de corpus monolingues, et de textes déjà traduits et validés (corpus multilingues). Ils réduisent significativement les coûts et les délais de personnalisation à un domaine spécialisé.

Le moteur hybride bénéficie du même niveau de performance, de vitesse et de robustesse qui a fait la réputation de SYSTRAN depuis de nombreuses années. Les modules statistiques agissent à chaque phase du processus (analyse, transfert, post-édition) pour améliorer la qualité de traduction.

La combinaison des technologies "rule-based" et "statistique" permet de réduire considérablement le volume de données nécessaires pour l'entrainement du logiciel. Par conséquent, la taille des modèles statistiques générés puis mis en œuvre est également réduite, ce qui constitue un avantage en termes de performance et de configuration requise.

Une réponse parfaite aux besoins des clients

Le moteur hybride permet d'atteindre les objectifs des entreprises en termes de qualité de traduction, d'investissement et de productivité.

La personnalisation du logiciel à un domaine particulier repose sur un large éventail de ressources pour améliorer la qualité de traduction : dictionnaires, glossaires, mémoires de traductions, corpus monolingues et bilingues. Le moteur hybride est entrainé sur des corpus existants et prend en compte les dictionnaires ou les glossaires de l'entreprise. Il utilise les corpus pour générer automatiquement des modèles statistiques (modèles de langue et modèles de traduction résultant de l'apprentissage automatique) qui sont ensuite utilisés lors du processus de traduction, mais aussi pour créer de nouveaux dictionnaires terminologiques. La maintenance continue de ces ressources améliore la qualité de traduction de manière incrémentale.

La mise en œuvre et la maintenance de solutions de traduction automatique basées sur cette technologie hybride est optimale en termes d'investissement. Les performances sont élevées et ne nécessitent pas de déployer d'importantes configurations matérielles. SYSTRAN valorise ainsi tous les actifs linguistiques disponibles dans l'entreprise pour améliorer la qualité de traduction, en réduisant les coûts de personnalisation et de maintenance.

Les traducteurs réalisent des gains de temps importants en révisant les traductions et ont la certitude de produire des traductions fidèles et homogènes. Les résultats de cette révision (post-édition) sont réutilisables pour entrainer le moteur de manière incrémentale, et éviter que le logiciel fasse deux fois la même erreur.

Qualité de traduction "généraliste", respect de la terminologie d'entreprise et performance

Chaque paire de langue est développée sur la même technologie de traduction et intègre les dernières innovations en traitement automatique du langage. Le moteur hybride met en œuvre une importante gamme de ressources linguistiques pour des traductions précises et homogènes.

La "connaissance" linguistique embarquée dans le moteur garantit une bonne qualité de traduction sur le domaine général dans les 52 paires de langues. Les utilisateurs peuvent ajouter leur propre terminologie pour améliorer la qualité de traduction dans un domaine ou contexte professionnel particulier, et garantir la conformité avec la terminologie de l'entreprise. Le moteur hybride offre le même niveau de performance qui a fait la réputation de SYSTRAN auprès de ses clients depuis de nombreuses années.

Une personnalisation peu coûteuse pour une qualité et une productivité améliorées

Les traitements statistiques sont appliqués à chaque phase du processus de traduction. Des modèles de langues génériques ou spécifiques à chaque client améliorent la résolution des ambigüités du texte source. Des modèles de traduction entrainés à partir de corpus bilingues garantissent la conformité de la traduction avec les traductions existantes. Le moteur hybride peut être entrainé sur des corpus monolingues et bilingues même limités pour personnaliser la traduction à un domaine particulier. Les traitements statistiques sont également mis en oeuvre pour construire des ressources terminologiques et linguistiques additionnelles, à leur tour prises en compte par le moteur. Ce cercle vertueux permet une personnalisation peu coûteuse tout en garantissant le respect de la terminologie d'entreprise et en capitalisant sur les ressources construites.