|
ドキュメント
デモを予約プラットフォーム
プラットフォーム
MCPCLIAPIワークフロー
ガイド変更履歴

はじめに

  • イントロダクション
  • エンジンを接続

ローカライゼーションエンジン

  • 概要
  • ブランドボイス
  • Instructions
  • 用語集
  • LLMモデル
  • キャッシュトークン
  • ロケール解決

品質

  • レポート
  • AI評価者
  • プレイグラウンド
  • エンジン提案

管理

  • APIキー
  • チーム
  • ロールと権限
  • 監査ログ

レポート

レポートを使うと、ローカライゼーションエンジンの稼働状況をひと目で把握できます。確認できるのは、翻訳量、トークン使用量、ロケールのカバレッジ、用語集の充実度、コードベースの変更率、AI評価者による品質指標です。すべてのレポートは組織単位で集計され、リクエストがエンジンを通過するたびに自動で更新されます。

利用できるレポート#

レポート測定内容
単語生成数1日あたりの翻訳語数
トークン消費量1日あたりの入力・出力トークン使用量
上位ロケール最も多くのリソースを消費しているロケール
用語集の充実度ロケールごとの用語集登録数
変更率GitHub上のローカライズファイルの変更状況(ロケール別)
平均スコアAI評価者による1日あたりの平均翻訳スコア
用語適用率翻訳で用語集の用語がどれだけ一貫して適用されているか
指示遵守率翻訳でカスタム指示がどれだけ一貫して守られているか

単語生成数#

ローカライゼーションエンジンで処理された総単語数を、日別に集計して追跡します。翻訳量の推移を把握し、キャパシティ計画に役立てられます。

フィルター: エンジン、期間(月)、ソースロケール、ターゲットロケール

グラフには、選択した月の各日ごとに1本の棒が表示されます。翻訳アクティビティがなかった日は0として表示されます。

トークン消費量#

LLMのトークン使用量を、入力トークンと出力トークンに分けて日別に集計・可視化します。トークン消費量はコストに直結するため、このレポートを使えばコスト急増の原因特定や、エンジン間・ロケールペア間での効率比較に役立ちます。

フィルター: エンジン、期間(月)、ソースロケール、ターゲットロケール

入力トークンと出力トークン

入力トークンには、system prompt、用語集、ブランドボイス、指示、ソーステキストが含まれます。出力トークンは翻訳結果です。入力に対して出力の比率が低い場合は、翻訳対象のコンテンツに対してエンジンのコンテキスト(用語集や指示)が大きい可能性があります。

上位ロケール#

リソース消費量に基づいてロケールをランキングし、どの言語が翻訳量とコストの大半を占めているかを把握できます。ソースロケール別またはターゲットロケール別に表示でき、入力トークン、出力トークン、または単語数で比較できます。

フィルター: エンジン、期間(月)、ロケール種別(ソースまたはターゲット)、指標(入力トークン、出力トークン、または単語数)

このレポートでは、たとえば「どのターゲットロケールが最も多くのトークンを消費しているか?」や「どのソース言語が最も多くの単語を生成しているか?」といった問いに答えられます。

用語集の充実度#

各エンジンで、ロケールごとにどれだけの用語集項目が登録されているかを表示します。他のレポートと違い、これは時系列データではなく現在のスナップショットであり、用語集設定の現時点での状態を反映します。

フィルター: エンジン、ロケール種別(ソースまたはターゲット)

不足している領域の特定に役立ちます。たとえば、エンジンが12のロケールに翻訳していても、用語集エントリがあるのが3つだけなら、未カバーのロケールでは用語選択をモデルの判断に完全に委ねることになります。

変更率#

接続済みのGitHubリポジトリ内で発生したローカライズファイルの変更頻度を、ロケール別・日別に追跡します。このレポートを利用するには有効なGitHub連携が必要です。未設定の場合は、GitHubへの接続を求められます。

フィルター: 期間(月)、リポジトリ、ロケール

変更率レポートは、「各ロケールがどれくらい活発に更新されているか?」や「どのリポジトリで最も多くのローカライズ変更が発生しているか?」といった問いに答えるのに役立ちます。

タイムゾーン対応

日付のグループ化は、組織で設定されたタイムゾーンに従います。たとえば23:30 UTC のコミットも、翌日にずれることなく正しいローカル日付で表示されます。

平均スコア#

AI評価者による日次の平均翻訳スコアを、パーセンテージで表示します。これにより、品質の推移を時系列で追跡し、エンジン、モデル、または用語集の変更後に起きた品質低下を見つけやすくなります。

フィルター: エンジン、期間(月)、表示(集計または内訳)

単一のエンジンを表示している場合、各線はそのエンジンに紐づく1つの採点者を表します。すべてのエンジンを横断して表示している場合は、すべてのエンジンのすべての採点者を平均した1本の線を表示する 集計 と、採点者ごとに並べて比較できる 内訳 を選べます。

AI評価者が必要です

このレポートにデータが表示されるのは、少なくとも1人のAI評価者が設定され、翻訳の採点を行っている場合のみです。

用語適用率#

翻訳で用語集の用語が毎日どれだけ一貫して正しく適用されているかを追跡します。折れ線は日次の適用率(正しく適用された用語 ÷ 関連する全用語)を示し、棒は適用された用語の絶対数を示します。ホバーすると、適用数/総数の内訳と、そのデータポイントのもとになったレビュー件数を確認できます。

フィルター: エンジン、期間(月)

適用用語数が多い一方で適用率が下がっている場合、翻訳量の増加に伴って用語集の用語が見落とされたり、誤って翻訳されたりする頻度が高まっているサインです。用語集やエンジンの指示を見直すべき早期警告として役立ちます。

指示遵守率#

エンジンのカスタムinstructionsが、翻訳で毎日どれだけ一貫して守られているかを追跡します。このパーセンテージは、instructions が実際に関連していたレビューのみを対象に算出されます。ツールチップにはfollowed / relevantが表示されるため、遵守率とサンプル数の両方を確認できます。

フィルター: エンジン、期間(月)

新しく追加した指示が実際に挙動を変えているかを確認したり、モデルの切り替えやプロンプト変更後にエンジンがルールを無視し始めるような後退を検知したりするのに役立ちます。

フィルタリングと期間#

時間ベースのレポートはすべて月単位で動作します。デフォルトは当月です。フィルターはURLに保持されるため、絞り込み済みの表示を共有したり、ブックマークしたりできます。

レポート全体で共通して使えるフィルター:

フィルター利用可能なレポート説明
エンジン単語生成数、トークン消費量、上位ロケール、用語集の充実度、平均スコア、用語適用率、指示遵守率特定のエンジンに絞り込むか、すべてを表示
期間単語生成数、トークン消費量、上位ロケール、変更率、平均スコア、用語適用率、指示遵守率月を選択(YYYY-MM)
ソースロケール単語生成数、トークン消費量ソース言語で絞り込む
ターゲットロケール単語生成数、トークン消費量ターゲット言語で絞り込む
リポジトリ変更率GitHubリポジトリで絞り込む
表示平均スコア集計した1本の線、または採点者ごとの内訳

品質と量#

レポートは、相互に補完し合う2つのビューに分かれます。量とコスト(単語生成数、トークン消費量、上位ロケール、用語集の充実度、変更率)と、品質(平均スコア、用語適用率、指示遵守率)です。品質レポートの利用には、少なくとも1人のAI評価者の設定が必要です。

次のステップ#

AI評価者
翻訳品質の自動モニタリングを設定する
LLMモデル
ロケールごとのモデル選択とフォールバックを設定する
用語集
ロケール全体での用語集カバレッジを改善する
APIリファレンス
ローカライゼーションAPIをワークフローに統合する

このページは役に立ちましたか?

Max PrilutskiyMax Prilutskiy·更新済み 2か月前·1分で読めます