|
Dokumentation
Demo buchenPlattform
PlattformMCP
CLIAPIWorkflows
LeitfädenChangelog

Erste Schritte

  • So funktioniert's
  • Einrichtung
  • Funktionen

Workflows

  • Engine erstellen
  • Glossar importieren
  • Inhalte lokalisieren
  • Anfragen prüfen
  • Untersuchen
  • Engine optimieren
  • Stichprobe
  • Engines vergleichen
  • Sprache hinzufügen

Import aus Altsystemen

Wenn Sie von einem älteren Lokalisierungsanbieter oder TMS migrieren, liegen Ihre Glossare, Terminologiedatenbanken oder Translation-Memory-Exporte wahrscheinlich in TMX-, CSV- oder TBX-Dateien vor. Ihr KI-Assistent kann diese analysieren und die Konfiguration Ihrer Lokalisierungs-Engine direkt damit befüllen.

Der Workflow#

„Hier ist unser Glossarexport (CSV). Importiere ihn in das Glossar unserer Engine für alle Sprachen.“

So läuft es ab:

  1. Der Assistent liest die CSV-Struktur und erkennt die Spalten für Ausgangsbegriff, Ziel-Lokalisierung, Sprache und Begriffstyp
  2. Ordnet jede Zeile einem Glossareintrag zu: Ausgangstext, Zieltext, Sprachpaar und ob es sich um eine benutzerdefinierte Lokalisierung oder einen nicht übersetzbaren Begriff handelt
  3. Zeigt den Importplan an: „147 Begriffe in 6 Sprachen gefunden. 12 sind als nicht übersetzen markiert, 135 sind erzwungene Lokalisierungen.“
  4. Erstellt nach Freigabe alle Glossareinträge über das MCP
  5. Meldet: „147 Glossareinträge erstellt. 3 Duplikate übersprungen.“

Unterstützte Formate#

FormatInhaltSo stellen Sie es bereit
CSV / TSVTerminologiedatenbanken, Glossare, einfache zweisprachige ListenFügen Sie den Inhalt ein oder beschreiben Sie die Dateistruktur
TMXTranslation Memory – Quell-/Zielsegmentpaare mit MetadatenFügen Sie ein repräsentatives Beispiel ein oder beschreiben Sie die Struktur
TBXTerminologiedatenbanken – strukturierte Terminologieeinträge mit DefinitionenFügen Sie den Inhalt ein oder beschreiben Sie das Schema
Excel-ExporteAnbieterspezifische Glossar- oder Styleguide-ExporteBeschreiben Sie die Spalten und fügen Sie repräsentative Zeilen ein

Schritt für Schritt: TMX-Import#

TMX-Dateien von älteren Anbietern enthalten Segmentpaare, die sich sowohl für Glossareinträge als auch für Anweisungen nutzen lassen.

„Hier ist ein TMX-Export von unserem vorherigen Anbieter. Er enthält 500 Übersetzungseinheiten für en → de. Extrahiere wiederkehrende Terminologie als Glossareinträge.“

So läuft es ab:

  1. Der Assistent analysiert die TMX-Struktur und erkennt Quellsegmente, Zielsegmente und Sprachpaare
  2. Gruppiert wiederkehrende Begriffe – Wörter oder Ausdrücke, die mindestens 3-mal mit konsistenten Lokalisierungen vorkommen
  3. Schlägt Glossareinträge für Begriffe mit stabilen Lokalisierungen vor: „‚privacy policy‘ → ‚Datenschutzerklärung‘ (kommt 12-mal vor und wird immer so lokalisiert)“
  4. Erkennt Muster, die zu Anweisungen werden sollten: „Zusammengesetzte Substantive werden in diesem Korpus immer mit Bindestrich geschrieben – als Anweisung für de hinzufügen?“
  5. Zeigt den vollständigen Plan zur Prüfung an
  6. Setzt ihn nach Freigabe um

Schritt für Schritt: CSV-Glossarimport#

Die meisten älteren Lokalisierungsplattformen exportieren Glossare als CSV mit Spalten für Quelle, Ziel, Sprache und Notizen.

„Importiere diese CSV in unsere Engine. Spalten: source_term, target_term, locale, type (localize/do-not-translate), notes.“

So läuft es ab:

  1. Der Assistent liest die Spaltenzuordnung
  2. Erstellt Glossareinträge: localize-Zeilen werden zu benutzerdefinierten Lokalisierungen, do-not-translate-Zeilen zu nicht übersetzbaren Einträgen
  3. Einträge mit Notizen, die Regeln beschreiben (nicht nur Definitionen), markiert er als potenzielle Anweisungen: „Die Notiz für ‚date format‘ lautet ‚Immer DD.MM.YYYY auf Deutsch verwenden‘ – als Anweisung für de hinzufügen?“
  4. Zeigt den Plan an und setzt ihn nach Freigabe um

Was importiert werden sollte – und was nicht#

Als Glossar importierenAls Anweisung importierenÜberspringen
Markennamen (nicht übersetzbar)Formatierungsregeln (Datum, Zahl, Währung)Unscharfe TM-Matches unter 95 %
Produktterminologie (erzwungene Lokalisierungen)InterpunktionsregelnKontextabhängige Segmentpaare
Rechtsbegriffe (erzwungene Lokalisierungen)Regeln zu Register/FormalitätEinmalige Lokalisierungen, die keine Terminologie sind
UI-Labels mit vorgeschriebenen LokalisierungenGroß- und KleinschreibungsregelnSegmente mit mehr als 2–3 Sätzen

Nach dem Import#

  1. Verifizieren – führen Sie einen Lokalisierungstest mit Inhalten durch, in denen die importierten Begriffe vorkommen
  2. Prüfen – prüfen Sie stichprobenartig ein Batch anhand des neuen Glossars, um die Durchsetzung zu bestätigen
  3. Optimieren – passen Sie Einträge an, die im Kontext nicht das richtige Ergebnis liefern

Tipps für große Importe#

  • Beginnen Sie mit häufigen Begriffen. Ein TM-Export mit 5.000 Einträgen ist kein Glossar, sondern ein Korpus. Bitten Sie den Assistenten, nur Begriffe zu extrahieren, die mindestens 3-mal vorkommen.
  • Importieren Sie in Batches nach Sprache. 50 deutsche Begriffe lassen sich leichter prüfen als 500 Begriffe in 10 Sprachen.
  • Nutzen Sie die Notizspalte. Wenn Ihr Export Übersetzerhinweise enthält, kann der Assistent Muster in Anweisungen umwandeln.
  • Importieren Sie keine TM auf Satzebene als Glossar. Glossareinträge sind Begriffe und kurze Ausdrücke. Ganze Sätze gehören in Referenzmaterial, nicht ins Glossar.

War diese Seite hilfreich?

Max PrilutskiyMax Prilutskiy·Aktualisiert vor etwa 2 Monaten·3 Min. Lesezeit