Wenn Sie von einem älteren Lokalisierungsanbieter oder TMS migrieren, liegen Ihre Glossare, Terminologiedatenbanken oder Translation-Memory-Exporte wahrscheinlich in TMX-, CSV- oder TBX-Dateien vor. Ihr KI-Assistent kann diese analysieren und die Konfiguration Ihrer Lokalisierungs-Engine direkt damit befüllen.
Der Workflow#
„Hier ist unser Glossarexport (CSV). Importiere ihn in das Glossar unserer Engine für alle Sprachen.“
So läuft es ab:
- Der Assistent liest die CSV-Struktur und erkennt die Spalten für Ausgangsbegriff, Ziel-Lokalisierung, Sprache und Begriffstyp
- Ordnet jede Zeile einem Glossareintrag zu: Ausgangstext, Zieltext, Sprachpaar und ob es sich um eine benutzerdefinierte Lokalisierung oder einen nicht übersetzbaren Begriff handelt
- Zeigt den Importplan an: „147 Begriffe in 6 Sprachen gefunden. 12 sind als nicht übersetzen markiert, 135 sind erzwungene Lokalisierungen.“
- Erstellt nach Freigabe alle Glossareinträge über das MCP
- Meldet: „147 Glossareinträge erstellt. 3 Duplikate übersprungen.“
Unterstützte Formate#
| Format | Inhalt | So stellen Sie es bereit |
|---|---|---|
| CSV / TSV | Terminologiedatenbanken, Glossare, einfache zweisprachige Listen | Fügen Sie den Inhalt ein oder beschreiben Sie die Dateistruktur |
| TMX | Translation Memory – Quell-/Zielsegmentpaare mit Metadaten | Fügen Sie ein repräsentatives Beispiel ein oder beschreiben Sie die Struktur |
| TBX | Terminologiedatenbanken – strukturierte Terminologieeinträge mit Definitionen | Fügen Sie den Inhalt ein oder beschreiben Sie das Schema |
| Excel-Exporte | Anbieterspezifische Glossar- oder Styleguide-Exporte | Beschreiben Sie die Spalten und fügen Sie repräsentative Zeilen ein |
Schritt für Schritt: TMX-Import#
TMX-Dateien von älteren Anbietern enthalten Segmentpaare, die sich sowohl für Glossareinträge als auch für Anweisungen nutzen lassen.
„Hier ist ein TMX-Export von unserem vorherigen Anbieter. Er enthält 500 Übersetzungseinheiten für en → de. Extrahiere wiederkehrende Terminologie als Glossareinträge.“
So läuft es ab:
- Der Assistent analysiert die TMX-Struktur und erkennt Quellsegmente, Zielsegmente und Sprachpaare
- Gruppiert wiederkehrende Begriffe – Wörter oder Ausdrücke, die mindestens 3-mal mit konsistenten Lokalisierungen vorkommen
- Schlägt Glossareinträge für Begriffe mit stabilen Lokalisierungen vor: „‚privacy policy‘ → ‚Datenschutzerklärung‘ (kommt 12-mal vor und wird immer so lokalisiert)“
- Erkennt Muster, die zu Anweisungen werden sollten: „Zusammengesetzte Substantive werden in diesem Korpus immer mit Bindestrich geschrieben – als Anweisung für
dehinzufügen?“ - Zeigt den vollständigen Plan zur Prüfung an
- Setzt ihn nach Freigabe um
Schritt für Schritt: CSV-Glossarimport#
Die meisten älteren Lokalisierungsplattformen exportieren Glossare als CSV mit Spalten für Quelle, Ziel, Sprache und Notizen.
„Importiere diese CSV in unsere Engine. Spalten: source_term, target_term, locale, type (localize/do-not-translate), notes.“
So läuft es ab:
- Der Assistent liest die Spaltenzuordnung
- Erstellt Glossareinträge:
localize-Zeilen werden zu benutzerdefinierten Lokalisierungen,do-not-translate-Zeilen zu nicht übersetzbaren Einträgen - Einträge mit Notizen, die Regeln beschreiben (nicht nur Definitionen), markiert er als potenzielle Anweisungen: „Die Notiz für ‚date format‘ lautet ‚Immer DD.MM.YYYY auf Deutsch verwenden‘ – als Anweisung für
dehinzufügen?“ - Zeigt den Plan an und setzt ihn nach Freigabe um
Was importiert werden sollte – und was nicht#
| Als Glossar importieren | Als Anweisung importieren | Überspringen |
|---|---|---|
| Markennamen (nicht übersetzbar) | Formatierungsregeln (Datum, Zahl, Währung) | Unscharfe TM-Matches unter 95 % |
| Produktterminologie (erzwungene Lokalisierungen) | Interpunktionsregeln | Kontextabhängige Segmentpaare |
| Rechtsbegriffe (erzwungene Lokalisierungen) | Regeln zu Register/Formalität | Einmalige Lokalisierungen, die keine Terminologie sind |
| UI-Labels mit vorgeschriebenen Lokalisierungen | Groß- und Kleinschreibungsregeln | Segmente mit mehr als 2–3 Sätzen |
Nach dem Import#
- Verifizieren – führen Sie einen Lokalisierungstest mit Inhalten durch, in denen die importierten Begriffe vorkommen
- Prüfen – prüfen Sie stichprobenartig ein Batch anhand des neuen Glossars, um die Durchsetzung zu bestätigen
- Optimieren – passen Sie Einträge an, die im Kontext nicht das richtige Ergebnis liefern
Tipps für große Importe#
- Beginnen Sie mit häufigen Begriffen. Ein TM-Export mit 5.000 Einträgen ist kein Glossar, sondern ein Korpus. Bitten Sie den Assistenten, nur Begriffe zu extrahieren, die mindestens 3-mal vorkommen.
- Importieren Sie in Batches nach Sprache. 50 deutsche Begriffe lassen sich leichter prüfen als 500 Begriffe in 10 Sprachen.
- Nutzen Sie die Notizspalte. Wenn Ihr Export Übersetzerhinweise enthält, kann der Assistent Muster in Anweisungen umwandeln.
- Importieren Sie keine TM auf Satzebene als Glossar. Glossareinträge sind Begriffe und kurze Ausdrücke. Ganze Sätze gehören in Referenzmaterial, nicht ins Glossar.
