Lorsque vous quittez un ancien prestataire de localisation ou un TMS, vous avez souvent des glossaires, des bases terminologiques ou des exports de mémoire de traduction au format TMX, CSV ou TBX. Votre assistant IA peut les analyser et alimenter directement la configuration de votre moteur de localisation.
Le workflow#
"Voici notre export de glossaire (CSV). Importez-le dans le glossaire de notre moteur pour toutes les langues."
Voici ce qui se passe :
- L’assistant lit la structure du CSV et identifie les colonnes du terme source, de la localisation cible, de la langue et du type de terme
- Il associe chaque ligne à une entrée de glossaire : texte source, texte cible, paire de langues, et indication s’il s’agit d’une localisation personnalisée ou d’un terme non traduisible
- Il affiche le plan d’import : "147 termes trouvés dans 6 langues. 12 sont marqués comme non traduisibles, 135 sont des localisations imposées."
- Après approbation, il crée toutes les entrées du glossaire via le MCP
- Il indique : "147 entrées de glossaire créées. 3 doublons ignorés."
Formats pris en charge#
| Format | Contenu | Comment le fournir |
|---|---|---|
| CSV / TSV | Bases terminologiques, glossaires, listes bilingues simples | Collez le contenu ou décrivez la structure du fichier |
| TMX | Mémoire de traduction — paires de segments source/cible avec métadonnées | Collez un échantillon représentatif ou décrivez la structure |
| TBX | Bases terminologiques — entrées structurées avec définitions | Collez le contenu ou décrivez le schéma |
| Exports Excel | Exports de glossaire ou de guide de style propres au prestataire | Décrivez les colonnes et collez des lignes représentatives |
Étape par étape : import TMX#
Les fichiers TMX issus d’anciens prestataires contiennent des paires de segments qui peuvent alimenter à la fois les entrées du glossaire et les instructions.
"Voici un export TMX de notre ancien prestataire. Il contient 500 unités de traduction pour en → de. Extrayez toute terminologie récurrente sous forme d’entrées de glossaire."
Voici ce qui se passe :
- L’assistant analyse la structure du TMX et identifie les segments source, les segments cibles et les paires de langues
- Il regroupe les termes récurrents — mots ou expressions qui apparaissent 3 fois ou plus avec des localisations cohérentes
- Il propose des entrées de glossaire pour les termes dont les localisations sont stables : "'privacy policy' → 'Datenschutzerklärung' (apparaît 12 fois, toujours localisé ainsi)"
- Il repère les schémas qui devraient devenir des instructions : "Les noms composés sont toujours reliés par des traits d’union dans ce corpus — l’ajouter comme instruction pour
de?" - Il affiche le plan complet pour relecture
- Il l’applique après approbation
Étape par étape : import de glossaire CSV#
La plupart des anciennes plateformes de localisation exportent les glossaires en CSV avec des colonnes pour la source, la cible, la langue et les notes.
"Importez ce CSV dans notre moteur. Colonnes : source_term, target_term, locale, type (localize/do-not-translate), notes."
Voici ce qui se passe :
- L’assistant lit le mapping des colonnes
- Il crée les entrées du glossaire : les lignes
localizedeviennent des localisations personnalisées, les lignesdo-not-translatedeviennent des entrées non traduisibles - Les entrées dont les notes décrivent des règles, et pas seulement des définitions, sont signalées comme instructions potentielles : "La note pour 'date format' indique 'Toujours utiliser DD.MM.YYYY en allemand' — l’ajouter comme instruction pour
de?" - Il affiche le plan, puis l’applique après approbation
Ce qu’il faut importer et ce qu’il faut laisser de côté#
| Importer comme glossaire | Importer comme instruction | Ignorer |
|---|---|---|
| Noms de marque (non traduisibles) | Règles de formatage (date, nombre, devise) | Correspondances TM approximatives sous 95 % |
| Terminologie produit (localisations imposées) | Conventions de ponctuation | Paires de segments dépendantes du contexte |
| Termes juridiques (localisations imposées) | Règles de registre/de formalité | Localisations ponctuelles qui ne relèvent pas de la terminologie |
| Libellés d’interface avec localisations imposées | Règles de casse | Segments de plus de 2 à 3 phrases |
Après l’import#
- Vérifiez — lancez un test de localisation avec un contenu qui utilise les termes importés
- Relisez — vérifiez ponctuellement un lot par rapport au nouveau glossaire pour confirmer son application
- Ajustez — ajustez les entrées qui ne produisent pas le bon résultat en contexte
Conseils pour les imports volumineux#
- Commencez par les termes les plus fréquents. Un export TM de 5 000 entrées n’est pas un glossaire — c’est un corpus. Demandez à l’assistant d’extraire uniquement les termes qui apparaissent 3 fois ou plus.
- Importez par lots, langue par langue. Il est plus facile de relire 50 termes allemands que 500 termes répartis sur 10 langues.
- Exploitez la colonne des notes. Si votre export contient des notes de traducteur, l’assistant peut transformer les schémas récurrents en instructions.
- N’importez pas une mémoire de traduction au niveau de la phrase comme glossaire. Les entrées de glossaire sont des termes et des expressions courtes. Les phrases complètes ont leur place dans des documents de référence, pas dans le glossaire.
