既存のローカライゼーションベンダーや TMS から移行するなら、TMX、CSV、TBX ファイルに入った用語集、用語ベース、翻訳メモリのエクスポートが手元にあるはずです。AIアシスタントならそれらを解析し、ローカライゼーションエンジンの設定に直接取り込めます。
ワークフロー#
「用語集のエクスポート(CSV)です。すべてのロケール向けに、これをエンジンの用語集へインポートしてください。」
実行内容:
- アシスタントが CSV の構造を読み取り、原文用語、ターゲットのローカライズ、ロケール、用語タイプの列を特定します
- 各行を用語集エントリにマッピングします。原文テキスト、ターゲットテキスト、ロケールペア、そしてカスタムローカライズか翻訳不要用語かを判定します
- インポート計画を表示します: 「6つのロケールで 147 件の用語が見つかりました。12 件は翻訳不要、135 件は適用必須のローカライズです。」
- 承認後、MCP 経由ですべての用語集エントリを作成します
- 結果を報告します: 「147 件の用語集エントリを作成しました。重複 3 件はスキップしました。」
対応フォーマット#
| フォーマット | 含まれる内容 | 提供方法 |
|---|---|---|
| CSV / TSV | 用語ベース、用語集、シンプルな対訳リスト | 内容を貼り付けるか、ファイル構造を説明してください |
| TMX | 翻訳メモリ — メタデータ付きの原文/訳文セグメントペア | 代表的なサンプルを貼り付けるか、構造を説明してください |
| TBX | 用語データベース — 定義付きの構造化された用語エントリ | 内容を貼り付けるか、スキーマを説明してください |
| Excel エクスポート | ベンダー固有の用語集やスタイルガイドのエクスポート | 列の内容を説明し、代表的な行を貼り付けてください |
ステップ別: TMX のインポート#
既存ベンダーからの TMX ファイルには、用語集エントリと指示の両方の登録に使えるセグメントペアが含まれています。
「以前のベンダーから出力した TMX です。en → de の翻訳単位が 500 件入っています。繰り返し出てくる用語を用語集エントリとして抽出してください。」
実行内容:
- アシスタントが TMX の構造を解析し、原文セグメント、訳文セグメント、ロケールペアを特定します
- 繰り返し出現する用語をグループ化します — 3 回以上現れ、一貫したローカライズがされている単語やフレーズです
- ローカライズが安定している用語について、用語集エントリを提案します: 「'privacy policy' → 'Datenschutzerklärung'(12 回出現し、常にこのローカライズです)」
- 指示にすべきパターンを特定します: 「このコーパスでは複合名詞は常にハイフンで連結されています —
deの指示として追加しますか?」 - レビュー用に全体の計画を表示します
- 承認後に適用します
ステップ別: CSV 用語集のインポート#
多くの既存ローカライゼーションプラットフォームでは、原文、訳文、ロケール、メモの列を持つ CSV として用語集をエクスポートできます。
「この CSV をエンジンにインポートしてください。列は source_term、target_term、locale、type(localize/do-not-translate)、notes です。」
実行内容:
- アシスタントが列マッピングを読み取ります
- 用語集エントリを作成します:
localizeの行はカスタムローカライズ、do-not-translateの行は翻訳不要エントリとして登録されます - 定義だけでなくルールを説明しているメモがあるエントリは、指示候補としてフラグ付けされます: 「'date format' のメモに『ドイツ語では常に DD.MM.YYYY を使用』とあります —
deの指示として追加しますか?」 - 計画を表示し、承認後に適用します
インポートすべきもの/除外すべきもの#
| 用語集としてインポート | 指示としてインポート | スキップ |
|---|---|---|
| ブランド名(翻訳不要) | 書式ルール(日付、数値、通貨) | 95% 未満のあいまい TM 一致 |
| 製品用語(適用必須のローカライズ) | 句読点のルール | 文脈依存のセグメントペア |
| 法務用語(適用必須のローカライズ) | レジスター/フォーマリティのルール | 用語ではない単発のローカライズ |
| 指定ローカライズがある UI ラベル | 大文字・小文字のルール | 2〜3 文を超えるセグメント |
インポート後#
- Verify — インポートした用語を使うコンテンツで localization test を実行する
- Review — 新しい用語集が適用されているか、spot-check でバッチを確認する
- Tune — 文脈の中で期待どおりの出力にならないエントリを adjust する
大規模インポートのヒント#
- 頻出用語から始める。 5,000 件の TM エクスポートは用語集ではなくコーパスです。3 回以上出現する用語だけを抽出するようアシスタントに依頼してください。
- ロケールごとに分けてインポートする。 10 ロケールにまたがる 500 件の用語より、ドイツ語の 50 件の用語のほうがレビューしやすくなります。
- メモ列を活用する。 エクスポートに翻訳者メモがある場合、アシスタントはパターンを指示に変換できます。
- 文レベルの TM を用語集としてインポートしない。 用語集エントリは用語や短いフレーズ向けです。文全体は用語集ではなく、参考資料に入れるべきです。
