レポート - Lingo.dev

レポートを使うと、ローカライゼーションエンジンの稼働状況をひと目で把握できます。確認できるのは、翻訳量、トークン使用量、ロケールのカバレッジ、用語集の充実度、コードベースの変更率、AI評価者による品質指標です。すべてのレポートは組織単位で集計され、リクエストがエンジンを通過するたびに自動で更新されます。

利用できるレポート#

レポート	測定内容
単語生成数	1日あたりの翻訳語数
トークン消費量	1日あたりの入力・出力トークン使用量
上位ロケール	最も多くのリソースを消費しているロケール
用語集の充実度	ロケールごとの用語集登録数
変更率	GitHub上のローカライズファイルの変更状況（ロケール別）
平均スコア	AI評価者による1日あたりの平均翻訳スコア
用語適用率	翻訳で用語集の用語がどれだけ一貫して適用されているか
指示遵守率	翻訳でカスタム指示がどれだけ一貫して守られているか

単語生成数#

ローカライゼーションエンジンで処理された総単語数を、日別に集計して追跡します。翻訳量の推移を把握し、キャパシティ計画に役立てられます。

フィルター: エンジン、期間（月）、ソースロケール、ターゲットロケール

グラフには、選択した月の各日ごとに1本の棒が表示されます。翻訳アクティビティがなかった日は0として表示されます。

トークン消費量#

LLMのトークン使用量を、入力トークンと出力トークンに分けて日別に集計・可視化します。トークン消費量はコストに直結するため、このレポートを使えばコスト急増の原因特定や、エンジン間・ロケールペア間での効率比較に役立ちます。

フィルター: エンジン、期間（月）、ソースロケール、ターゲットロケール

入力トークンと出力トークン

入力トークンには、system prompt、用語集、ブランドボイス、指示、ソーステキストが含まれます。出力トークンは翻訳結果です。入力に対して出力の比率が低い場合は、翻訳対象のコンテンツに対してエンジンのコンテキスト（用語集や指示）が大きい可能性があります。

上位ロケール#

リソース消費量に基づいてロケールをランキングし、どの言語が翻訳量とコストの大半を占めているかを把握できます。ソースロケール別またはターゲットロケール別に表示でき、入力トークン、出力トークン、または単語数で比較できます。

フィルター: エンジン、期間（月）、ロケール種別（ソースまたはターゲット）、指標（入力トークン、出力トークン、または単語数）

このレポートでは、たとえば「どのターゲットロケールが最も多くのトークンを消費しているか？」や「どのソース言語が最も多くの単語を生成しているか？」といった問いに答えられます。

用語集の充実度#

各エンジンで、ロケールごとにどれだけの用語集項目が登録されているかを表示します。他のレポートと違い、これは時系列データではなく現在のスナップショットであり、用語集設定の現時点での状態を反映します。

フィルター: エンジン、ロケール種別（ソースまたはターゲット）

不足している領域の特定に役立ちます。たとえば、エンジンが12のロケールに翻訳していても、用語集エントリがあるのが3つだけなら、未カバーのロケールでは用語選択をモデルの判断に完全に委ねることになります。

変更率#

接続済みのGitHubリポジトリ内で発生したローカライズファイルの変更頻度を、ロケール別・日別に追跡します。このレポートを利用するには有効なGitHub連携が必要です。未設定の場合は、GitHubへの接続を求められます。

フィルター: 期間（月）、リポジトリ、ロケール

変更率レポートは、「各ロケールがどれくらい活発に更新されているか？」や「どのリポジトリで最も多くのローカライズ変更が発生しているか？」といった問いに答えるのに役立ちます。

タイムゾーン対応

日付のグループ化は、組織で設定されたタイムゾーンに従います。たとえば23:30 UTC のコミットも、翌日にずれることなく正しいローカル日付で表示されます。

平均スコア#

AI評価者による日次の平均翻訳スコアを、パーセンテージで表示します。これにより、品質の推移を時系列で追跡し、エンジン、モデル、または用語集の変更後に起きた品質低下を見つけやすくなります。

フィルター: エンジン、期間（月）、表示（集計または内訳）

単一のエンジンを表示している場合、各線はそのエンジンに紐づく1つの採点者を表します。すべてのエンジンを横断して表示している場合は、すべてのエンジンのすべての採点者を平均した1本の線を表示する集計と、採点者ごとに並べて比較できる内訳を選べます。

AI評価者が必要です

このレポートにデータが表示されるのは、少なくとも1人のAI評価者が設定され、翻訳の採点を行っている場合のみです。

用語適用率#

翻訳で用語集の用語が毎日どれだけ一貫して正しく適用されているかを追跡します。折れ線は日次の適用率（正しく適用された用語 ÷ 関連する全用語）を示し、棒は適用された用語の絶対数を示します。ホバーすると、適用数/総数の内訳と、そのデータポイントのもとになったレビュー件数を確認できます。

フィルター: エンジン、期間（月）

適用用語数が多い一方で適用率が下がっている場合、翻訳量の増加に伴って用語集の用語が見落とされたり、誤って翻訳されたりする頻度が高まっているサインです。用語集やエンジンの指示を見直すべき早期警告として役立ちます。

指示遵守率#

エンジンのカスタムinstructionsが、翻訳で毎日どれだけ一貫して守られているかを追跡します。このパーセンテージは、instructions が実際に関連していたレビューのみを対象に算出されます。ツールチップにはfollowed / relevantが表示されるため、遵守率とサンプル数の両方を確認できます。

フィルター: エンジン、期間（月）

新しく追加した指示が実際に挙動を変えているかを確認したり、モデルの切り替えやプロンプト変更後にエンジンがルールを無視し始めるような後退を検知したりするのに役立ちます。

フィルタリングと期間#

時間ベースのレポートはすべて月単位で動作します。デフォルトは当月です。フィルターはURLに保持されるため、絞り込み済みの表示を共有したり、ブックマークしたりできます。

レポート全体で共通して使えるフィルター:

フィルター	利用可能なレポート	説明
エンジン	単語生成数、トークン消費量、上位ロケール、用語集の充実度、平均スコア、用語適用率、指示遵守率	特定のエンジンに絞り込むか、すべてを表示
期間	単語生成数、トークン消費量、上位ロケール、変更率、平均スコア、用語適用率、指示遵守率	月を選択（`YYYY-MM`）
ソースロケール	単語生成数、トークン消費量	ソース言語で絞り込む
ターゲットロケール	単語生成数、トークン消費量	ターゲット言語で絞り込む
リポジトリ	変更率	GitHubリポジトリで絞り込む
表示	平均スコア	集計した1本の線、または採点者ごとの内訳

品質と量#

レポートは、相互に補完し合う2つのビューに分かれます。量とコスト（単語生成数、トークン消費量、上位ロケール、用語集の充実度、変更率）と、品質（平均スコア、用語適用率、指示遵守率）です。品質レポートの利用には、少なくとも1人のAI評価者の設定が必要です。

次のステップ#

AI評価者

翻訳品質の自動モニタリングを設定する

LLMモデル

ロケールごとのモデル選択とフォールバックを設定する

用語集

ロケール全体での用語集カバレッジを改善する

APIリファレンス

ローカライゼーションAPIをワークフローに統合する