Guide de codage des dictionnaires

Copyright © 2002 SYSTRAN


1. Introduction

1.1. Types d'entrées

Pour adapter les traductions en fonction de besoins terminologiques spécifiques, il est possible de :

  • Isoler des mots qui ne doivent pas être traduits : Entrées DNT (Ne pas traduire)
  • Créer des entrées multilingues pour modifier les traductions en cours en fournissant des équivalences ou en ajoutant de nouveaux mots.

1.1.1. Entrées DNT (Ne pas traduire)

Les entrées DNT (Ne pas traduire) sont utilisées pour empêcher la traduction de noms de sociétés, noms propres, noms de lieux, noms de marques déposées ou autres expressions à ne pas traduire.

Saisissez l'entrée DNT dans le dictionnaire telle quelle, sans la signification correspondante. Les règles de distinction majuscules/minuscules s'appliquent à toutes les entrées DNT. Entrez le mot, en faisant attention aux majuscules, aux accents, etc. Chaque entrée doit figurer sur une ligne distincte.

Dès que vous disposez d'une expression à ne pas traduire (DNT) de plus de trois mots, placez-la entre guillemets et essayez d'ajouter des indications externes telles que (nom propre) ou (lieu).
Reportez-vous à la section : Règles générales de codage.

Exemple 1. Entrées DNT

« George Bush » (nom propre) (masculin)
« Virgin Mega Store » (nom propre)
"Los Angeles" (ville)
Apple (entreprise)
Lu (entreprise)
Alcampo (entreprise)
Telefónica (entreprise)
Hoechst (nom de société)

Exemple 2. Anglais-Français

« Virgin Mega Store is not a virgin mega store »

Dictionnaire Texte traduit
« Virgin Mega Store » (nom propre) Virgin Mega Store n'est pas une mémoire mega vierge.

1.1.2. Entrées multilingues

Vous pouvez également modifier la traduction par défaut pour :

  • Donner un équivalent technique à un terme général
  • Définir la signification spécifique d'un mot en lui attribuant plusieurs possibilités de traduction
  • Ajouter des mots n'appartenant pas aux dictionnaires standard de SYSTRAN (Mot non trouvé)

Pour chaque entrée, spécifiez source=cible pour le format bilingue (les formats Microsoft Excel et multi-cible sont également disponibles ; pour plus de détails, référez-vous à la documentation de Dictionary Manager). Chaque entrée doit figurer sur une ligne distincte.

Exemple 3. Entrées multilingues

a game = un gibier
to play = jouer
a product = un produit

Il est possible d'entrer des mots simples et des mots composés à condition que la totalité de l'entrée soit traitée en tant qu'unité unique. Cette méthode s'apparente à celle utilisée dans un dictionnaire papier traditionnel dans lequel la traduction des mots composés est fournie avec l'entrée principale.

Exemple 4. Entrées multilingues simples et composées

a download store = une boutique en ligne
a drive shaft = un arbre d'entraînement
a watering can = un arrosoir
"all rights reserved" (phrase) = "tous droits réservés" (phrase)

La qualité des résultats de traduction dépend en grande partie de l'exactitude grammaticale du document d'origine et de l'utilisation appropriée de la ponctuation et des conventions typographiques de base.


1.2. Principes de codage

1.2.1. Séquences standard

Le principe général consiste à utiliser la forme canonique d'une entrée (la forme « la plus simple » figurant dans un dictionnaire papier, soit un mot unique, soit des mots composés). De cette façon, toutes les entrées sont reconnues, quelle que soit leur forme, fléchie ou non. À l'aide d'un vaste thésaurus linguistique, le système peut identifier le comportement linguistique de votre entrée et ajouter des informations implicites pour générer toutes les formes fléchies et conjuguées.

  • Pour les noms, entrez la forme nominative au singulier (pour certaines langues spécifiques) et non la forme plurielle. Quand une entrée est codée sous sa forme plurielle, le système considère uniquement la flexion plurielle.
  • Pour les adjectifs, entrez toujours la forme principale (singulier et masculin). Si un adjectif est codé au féminin ou pluriel, ses autres formes de base ne seront pas identifiées.
  • Pour les verbes, entrez l'infinitif (en anglais avec la particule to), et non la forme conjuguée. Si un verbe n'est pas codé sous sa forme procédurale (sa forme la plus fondamentale), il ne sera pas reconnu.

Lorsqu'une forme fléchie est entrée dans le dictionnaire au lieu de la forme canonique, le système traduit uniquement cette forme fléchie, et pas les autres formes fléchies.


1.2.2. Séquences protégées

Les séquences protégées correspondent aux termes et phrases (expressions fixes) qui ne font l'objet d'aucune analyse linguistique et sont acceptés tels quels dans la traduction finale. Par conséquent, aucune flexion n'est appliquée aux différents éléments et la séquence est traduite exactement telle qu'elle figure dans le dictionnaire. C'est pourquoi il est important de conserver dans votre dictionnaire le formatage d'origine de l'entrée. Si elle apparaît en majuscules dans votre document, entrez-la en majuscules dans votre dictionnaire.

Les séquences protégées doivent être entrées entre guillemets et leur catégorie grammaticale spécifiée entre parenthèses.
Reportez-vous à la section : Codage avancé : Forcer la catégorie grammaticale.

Exemple 5. Séquences protégées

"if desired" (phrase) = "si lo desea" (phrase)
"all rights reserved" (phrase) = "tous droits réservés" (phrase)
"OTAN" (nom)="NATO" (nom)
"bi-parting" (adjectif)="à deux battants" (adjectif)

Les entrées restent invariables, sauf indication contraire via des indications linguistiques ou des informations supplémentaires.
Reportez-vous à la section : Codage avancé : Forcer le nombre.

Des guillemets peuvent être utilisés pour l'ensemble ou une partie d'une expression fixe. Ils permettent d'utiliser des caractères spéciaux qui autrement ne seraient pas reconnus.

Example 6. Séquences protégées avec caractères spéciaux

Département « R&D » (nom) = département « R&D » (nom)

Les séquences de moins de deux lettres ou de plus de cinq mots doivent être placées entre guillemets.


1.2.3. Majuscules

L'utilisation des majuscules dans le dictionnaire adhère aux mêmes directives que celles applicables à la forme canonique. Ceci signifie que l'entrée doit respecter sa casse d'origine (en français et en allemand, la première lettre des noms propres est une majuscule). Sans cela, le système interprète les majuscules comme une indication linguistique supplémentaire.

Par exemple, si un mot est écrit en majuscules dans le document d'origine à traduire, il n'est pas nécessaire de l'écrire en majuscules dans le dictionnaire (excepté pour les séquences protégées), car le format d'origine est automatiquement détecté et respecté.

Exemple 7. Anglais-Français

« We offer Machine Translation. »

Niveau de codage Dictionnaire Texte traduit
Intuitif machine translation = traduction automatique Nous proposons de la Traduction Automatique.

En fait, dans la plupart des langues, l'utilisation de lettres majuscules indique des noms propres ou des acronymes. Il est donc conseillé de limiter les majuscules à ces situations.


1.2.4. Accentuation

L'utilisation des caractères accentués dans le dictionnaire adhère aux mêmes directives que celles applicables à la forme canonique. Ceci signifie que l'entrée doit être correctement accentuée pour être ensuite correctement reconnue et interprétée par le système.


1.3. Amélioration du codage : Indications linguistiques

SYSTRAN Dictionary Manager offre la possibilité d'ajouter des informations linguistiques spécifiques (« indications linguistiques ») aux entrées des dictionnaires. L'utilisation d'indications linguistiques améliore considérablement l'analyse linguistique et donc la traduction. Il existe deux niveaux de codage principaux :

  1. Codage intuitif : ajout d'indications linguistiques conviviales comme des déterminants ou des particules. Ce codage intuitif n'exige pas de connaissances linguistiques particulières.
  2. Codage avancé : ajout d'informations externes telles que la catégorie grammaticale, le genre ou le contexte d'une entrée. Ce niveau exige des connaissances linguistiques élémentaires voire avancées.

Notez que les deux niveaux sont compatibles et peuvent être utilisés dans le même dictionnaire.


2. Codage intuitif

Le codage intuitif consiste à ajouter des indications grammaticales intuitives à une entrée afin de fournir davantage d'informations sur sa forme naturelle.

L'ajout de ces indications intuitives simples (déterminants, particules) fournit au système des informations précieuses sur le type de l'entrée : nom, verbe ou expression (phrase), masculin ou féminin, singulier ou pluriel.

Exemple 8. Dictionnaire Espagnol-Anglais avec codage intuitif

una interfaz = an interface
ejecutar = to run
unos tipógrafos = a typeface

2.1. Forcer la catégorie grammaticale

Quand une entrée est ambiguë, il est possible de forcer sa catégorie grammaticale en lui ajoutant un déterminant (article défini ou indéfini).

Exemple 9. Anglais-Français

« They run the run every week. »

Niveau de codage Dictionnaire Texte traduit
Intuitif to run = faire partie de
a run = une course
Ils font partie de la course chaque semaine.

2.2. Forcer le genre

Quand les dictionnaires SYSTRAN contiennent seulement la forme masculine ou féminine d'une entrée, ou quand une entrée est ambiguë, il est possible d'en forcer le genre en ajoutant un déterminant à l'entrée.

Exemple 10. Anglais-Français

« He left a check mark in the book. »

Niveau de codage Dictionnaire Texte traduit
Général check mark = coche Il a laissé un coche dans le livre.
Intuitif check mark = une coche Il a laissé une coche dans le livre.

2.3. Forcer le nombre

Quand une entrée au singulier doit être traduite par une forme plurielle, il est possible d'en forcer le nombre en ajoutant la forme plurielle dans le dictionnaire.

Exemple 11. Anglais-Espagnol

« His business is prosperous. »

Niveau de codage Dictionnaire Texte traduit
Général business = negocio Su negocio es próspero.
Intuitif business = negocios Sus negocios son prósperos.

Ici, le sujet business sera traduit dans la forme plurielle espagnole negocios et les éléments dépendants subiront la flexion au pluriel (verbe, adjectifs, déterminants).


3. Codage avancé

Les caractéristiques qui relèvent du codage avancé sont à ce jour la meilleure preuve de la haute capacité de personnalisation de SYSTRAN. Ces fonctionnalités permettent d'atteindre un meilleur niveau de personnalisation dans la traduction. Un utilisateur doit néanmoins disposer d'une bonne compréhension générale des phénomènes linguistiques pour définir la flexion d'une entrée.

Le codage avancé permet un plus haut niveau de personnalisation : cette pratique consiste à ajouter des informations linguistiques avancées (sémantique, syntaxe, morphologie, contexte) à la forme naturelle d'une entrée. Ces indications linguistiques sont toujours mises entre parenthèses.

Chaque langue comporte son propre jeu d'indications linguistiques.

Exemple 12. Dictionnaire Anglais-Français

« Virgin Mega Store » (nom propre)
John (nom propre) (masculin)
Portugal = Portugal (pays)
red = rouge (adjectif)
check box = case à cocher (féminin)
business = affaires (pluriel)

3.1. Morphologie

3.1.1. Forcer la catégorie grammaticale

Quand la catégorie grammaticale d'une entrée est ambiguë, il est possible de la spécifier. Elle doit être ajoutée entre parenthèses à côté de l'entrée.

  • Pour une entrée de verbe : (verbe)
  • Pour une entrée d'adjectif : (adjectif)
  • Pour une entrée d'adverbe : (phrase)
  • Pour une entrée de nom : (nom)
  • Pour les noms propres : (nom propre)
  • Pour un acronyme : (acronyme)

3.1.2. Forcer le genre

Si les dictionnaires SYSTRAN contiennent la forme masculine d'une entrée (ou si elle est supposée comme telle), ou si une entrée est ambiguë, il est possible de forcer la forme féminine en ajoutant le genre de l'entrée entre parenthèses. Naturellement, la forme masculine peut également être imposée aux entrées de forme féminine.

Ceci s'applique uniquement aux noms et aux noms propres, en ajoutant (masculin) ou (féminin).

Exemple 13. Anglais-Français

« He left a check mark in the book. »

Niveau de codage Dictionnaire Texte traduit
Général check mark = coche Il a laissé un coche dans le livre.
Intuitif check mark = coche (féminin) Il a laissé une coche dans le livre.

Ici, le mot français coche apparaît dans le dictionnaire monolingue français de SYSTRAN, mais uniquement en tant que nom masculin (et donc ne correspond pas au nom anglais check mark

En ajoutant le genre au dictionnaire utilisateur, à l'aide de l'indication grammaticale (féminin), l'entrée est indiquée comme étant féminine indépendamment du contenu du dictionnaire monolingue, et doit être traitée en tant que telle.


3.1.3. Forcer le nombre

Quand une entrée au singulier doit être traduite par une forme plurielle, il est possible d'en forcer le nombre en ajoutant l'indication grammaticale correspondant entre parenthèses.

Ceci s'applique uniquement aux noms, en ajoutant (singulier) ou (pluriel).

Exemple 14. Anglais-Espagnol

« His business is prosperous. »

Niveau de codage Dictionnaire Texte traduit
Général business = negocio Su negocio es próspero.
Intuitif business = negocio (pluriel) Sus negocios son prósperos.

Ici, le sujet business sera traduit dans la forme plurielle espagnole negocios et les éléments dépendants subiront la flexion au pluriel (verbe, adjectifs, déterminants).


3.1.4. Inflects like

À l'aide de cette fonction de codage avancé, il est possible d'indiquer au système le paradigme de flexion approprié pour une entrée inconnue en fournissant une autre entrée qui appartient à la même catégorie grammaticale et qui subit la même flexion. Ainsi, la fonction aide le système à identifier le modèle de flexion et à l'appliquer à l'entrée. Ceci s'effectue pour toutes les catégories grammaticales en ajoutant l'indication (inflects like: XXX).

Exemple 15. Français-Anglais

« Il formate son fichier. »

Niveau de codage Dictionnaire Texte traduit
Général formater = to format He is formating his file.
Intuitif formater = to format (inflects like: to quit) He is formatting his file.

3.1.5. Forme plurielle

Pertinente uniquement pour le codage des noms, cette fonction de codage avancé permet aux utilisateurs de forcer une forme plurielle particulière à l'aide de (plural: XXX).

Cette caractéristique fournit non seulement le moyen de traduire une entrée source au singulier en une entrée au pluriel, mais elle permet également d'indiquer le modèle de flexion souhaité pour l'entrée particulière. Ainsi, le système ne choisira plus la forme trouvée dans les ressources linguistiques de SYSTRAN (tables de flexion et dictionnaire monolingue), mais celle spécifiée par l'utilisateur.

La fonction de codage avancé de forme plurielle est très utile pour coder des lexiques d'origine latine ou grecque dans lesquels la forme plurielle n'est pas toujours bien identifiée par le système.

Exemple 16. Anglais-Français

« He has written many interesting film scripts. »

Niveau de codage Dictionnaire Texte traduit
Général film script = scénario Il a écrit beaucoup de scénarios intéressants.
Intuitif film script = scénario (plural: scénarios) Il a écrit beaucoup de scénari intéressants.

3.2. Syntaxe

3.2.1. Prépositions

Une préposition peut être liée à des noms, des verbes ou des adjectifs. La préposition doit être spécifiée pour les entrées source et cible à l'aide de (prep: XXX).

Si une entrée n'exige pas de préposition, il est nécessaire d'ajouter (noprep).

Exemple 17. Anglais-Français

« He protects his car from the rain. »

Niveau de codage Dictionnaire Texte traduit
Général to protect = protéger Il protège sa voiture contre la pluie.
Intuitif to protect (prep: from) = protéger (prep: de) Il protège sa voiture de la pluie.

Exemple 18. Français-Anglais

« Le maire fait don de son terrain. »

Niveau de codage Dictionnaire Texte traduit
Général faire don = to offer The mayor offered of his ground.
Intuitif faire don (prep: de) = to offer (noprep) The mayor offers his field.

3.2.2. Utilisation de crochets

Les métacaractères représentant des crochets ([...]) permettent d'isoler une entrée composée se trouvant dans une autre entrée plus grande. Ceci clarifie la relation entre les éléments d'un mot composé, et de ce fait améliore la traduction. Ils sont particulièrement utiles dans le cadre de traductions effectuées à partir d'une source anglaise.

Exemple 19. Anglais-Espagnol

« The technical support hours are available on the Web site. »

Niveau de codage Dictionnaire Texte traduit
Général technical support hour = horario del servicio técnico Las horas técnicas de la ayuda están disponibles en el website.
Intuitif technical support hour = horario del [servicio técnico] Los horarios del servicio técnico están disponibles en el sitio web.

3.3. Sémantique

3.3.1. Ajout d'une catégorie sémantique

Ces catégories modifient la préposition ou le déterminant qui introduit l'entrée dans la traduction.

Les catégories sémantiques suivantes s'appliquent aux noms propres seulement.

  • (lieu)
  • (ville)
  • (pays)
  • (prénom)
  • (patronyme)
  • (nom de produit)
  • (entreprise)

 

Les catégories sémantiques suivantes s'appliquent aux noms et noms propres.

  • (humain)
  • (non humain)

Exemple 20. Anglais-Français

« Portugal is a beautiful country. »

Niveau de codage Dictionnaire Texte traduit
Général Portugal = Portugal Portugal est un beau pays.
Intuitif Portugal = Portugal (pays) Le Portugal est un beau pays.

3.4. Contexte

Il est possible de contrôler la traduction des entrées polysémiques en définissant leur contexte sémantique et/ou syntaxique.

3.4.1. Catégorie sémantique

Chaque nom peut être lié à une ou plusieurs catégories sémantiques. Pour ce faire, ajoutez (semcat: XXXX)XXXX est le nom de la catégorie définie par l'utilisateur (nom majuscule alphabétique).

Pour utiliser ces catégories sémantiques, le dictionnaire doit contenir des entrées contextuelles syntaxiques qui rappellent les catégories.


3.4.2. Contexte syntaxique

Chaque verbe peut être lié à des contextes syntaxiques spécifiques. Pour ce faire, ajoutez (context: XXXX). XXXX peut être un nom ou une catégorie sémantique devant avoir déjà été définie dans le dictionnaire.

Exemple 21. Création et utilisation de catégories sémantiques. Anglais-Espagnol

« He saved three files. He saved the records. He saved many repertories. He saved money. He saved energy. »

Dictionnaire Texte traduit
file (semcat : FILE)=fichero
record (semcat: FILE)=archivo
repertory (semcat: FILE)=repertorios
money (semcat: RESOURCE)=dinero
energy (semcat: RESOURCE)=energía
to save (context: FILE)=guardar
to save (context: RESOURCE)=ahorrar
Él guardó tres ficheros.
Él guardó los archivos.
Él guardó muchos repertorios.
Él ahorró el dinero.
Él ahorró la energía el dinero.

Exemple 22. Contexte syntaxique simple. Anglais-Italien

« My soul was saved. The files were saved. »

Dictionnaire Texte traduit
to save (context: a soul) = liberare
to save (context: a file) = conservare
La mia anima è stata liberata.
Le lime sono state conservate.

3.5. Fonctions de codage expert

3.5.1. Forme nominale

En indiquant la forme nominale dérivée d'une entrée verbale, SYSTRAN offre au système une alternative de traduction utilisant la forme nominale, à l'aide de (noun form: XXX) pour les verbes.

Exemple 23. Anglais-Français

« Using this tool is simple. »

Niveau de codage Dictionnaire Texte traduit
Avancé to use = utiliser (noun form: utilisation) L'utilisation de cet outil est simple.

Veuillez compléter l'information ci-dessous pour télécharger le document.

*Champs obligatoires

Des informations n'ont pas été correctement renseignées. Veuillez compléter les champs encadrés en rouge

Informations société
Information contact
Code de sécurité

Saisissez les caractères comme visibles dans l'image ci-dessus (sans différentiation de casse). Veuillez cliquer sur l'image si vous avez des difficultés pour lire ces caractères.