报告让你全面掌握本地化引擎的运行表现,包括翻译量、token 用量、语言区域覆盖、术语表深度、代码库变更速率,以及 AI 审校质量指标。所有报告均按组织范围统计,并会随着请求流经引擎自动更新。
可用报告#
| 报告 | 衡量指标 |
|---|---|
| 词量生成 | 每日翻译词数 |
| Token 消耗 | 每日输入与输出 token 用量 |
| 热门语言区域 | 哪些语言区域消耗的资源最多 |
| 术语表深度 | 各语言区域的术语表词条数量 |
| 变更速率 | 按语言区域统计的 GitHub 本地化文件变更情况 |
| 平均评分 | 来自 AI 审校器的每日平均翻译评分 |
| 术语覆盖率 | 术语表词条在翻译中的应用一致性 |
| 指令遵循度 | 自定义指令在翻译中的执行一致性 |
词量生成#
按天汇总追踪本地化引擎处理的总词数,帮助你了解翻译量趋势并做好容量规划。
筛选条件: 引擎、周期(月)、源语言区域、目标语言区域
图表会按所选月份逐日显示柱状数据。没有翻译活动的日期将显示为 0。
Token 消耗#
按天汇总监控 LLM token 使用情况,并区分输入 token 与输出 token。token 消耗会直接反映成本——你可以借助这份报告识别成本峰值,并比较不同引擎或语言区域组合之间的效率。
筛选条件: 引擎、周期(月)、源语言区域、目标语言区域
输入 token vs. 输出 token
输入 token 包括系统提示词、术语表、品牌语调、指令以及源文本;输出 token 则是翻译结果。若输入输出比偏高,可能说明相较于实际翻译内容,引擎上下文(如术语表、指令)占据了更大比例。
热门语言区域#
按资源消耗对语言区域进行排名,帮助你找出哪些语言带来了最多的翻译量与成本。你可以按源语言区域或目标语言区域查看排行,并按输入 token、输出 token 或词数进行衡量。
筛选条件: 引擎、周期(月)、语言区域类型(源或目标)、指标(输入 token、输出 token 或词数)
这份报告可以回答这样的问题:“哪个目标语言区域消耗了最多 token?”或“哪种源语言产生了最多词数?”
术语表深度#
显示各引擎中每个语言区域的术语表词条数量。与其他报告不同,这是一份当前快照,而非时间序列数据,用于反映术语表配置的现状。
筛选条件: 引擎、语言区域类型(源或目标)
你可以借此发现覆盖缺口:如果引擎支持翻译到 12 个语言区域,但只有 3 个配置了术语表词条,那么其余未覆盖的语言区域在术语选择上将完全依赖模型判断。
变更速率#
按语言区域和日期细分,追踪已连接 GitHub 仓库中的本地化文件变更速率。此报告需要启用 GitHub 集成——如果尚未设置,系统会提示你连接 GitHub。
筛选条件: 周期(月)、仓库、语言区域
变更速率报告有助于回答:“各语言区域的更新活跃度如何?”以及“哪些仓库产生了最多本地化变更?”
时区支持
日期分组会遵循你组织设置的时区。比如在 UTC 23:30 的一次提交,会显示在正确的本地日期,而不会被顺延到第二天。
平均评分#
以百分比形式展示来自你的 AI reviewers 的每日平均翻译评分。你可以用它追踪质量走势,并在引擎、模型或术语表发生变化后及时发现质量回退。
筛选条件: 引擎、周期(月)、视图(汇总或拆分)
查看单个引擎时,每条线代表一个挂载到该引擎的评分器。查看所有引擎时,可选择 汇总,用一条线展示所有引擎、所有评分器的平均值;也可选择 拆分,并排比较不同评分器。
需要 AI reviewers
只有在至少配置了一个 AI reviewer 并开始为翻译打分后,此报告才会显示数据。
术语覆盖率#
按天追踪术语表词条在翻译中被正确应用的一致性。折线表示每日覆盖率百分比(正确应用词条 ÷ 相关词条总数);柱状表示已应用词条的绝对数量。悬停时可查看已应用/总数的明细,以及每个数据点背后的审校次数。
筛选条件: 引擎、周期(月)
如果已应用词条数量很高,但覆盖率却持续下降,就说明随着翻译量增长,术语表词条被遗漏或误译的情况越来越频繁——这是一个很有价值的预警信号,提示你需要检查术语表或引擎指令。
指令遵循度#
按天追踪引擎自定义 instructions 在翻译中的执行一致性。该百分比仅基于“指令确实相关”的审校结果计算——工具提示会显示 followed / relevant,让你同时看到比率和样本量。
筛选条件: 引擎、周期(月)
你可以用它验证新添加的指令是否真的改变了行为,也能在模型切换或提示词调整后,及时发现引擎开始忽略规则的回退情况。
筛选与周期#
所有基于时间的报告都以月为统计周期,默认显示当前月份。筛选条件会保留在 URL 中,因此筛选后的视图既可分享,也可收藏。
各报告中的常见筛选条件:
| 筛选条件 | 适用范围 | 说明 |
|---|---|---|
| 引擎 | 词量生成、Token 消耗、热门语言区域、术语表深度、平均评分、术语覆盖率、指令遵循度 | 聚焦某个特定引擎,或查看全部引擎 |
| 周期 | 词量生成、Token 消耗、热门语言区域、变更速率、平均评分、术语覆盖率、指令遵循度 | 选择月份(YYYY-MM) |
| 源语言区域 | 词量生成、Token 消耗 | 按源语言筛选 |
| 目标语言区域 | 词量生成、Token 消耗 | 按目标语言筛选 |
| 仓库 | 变更速率 | 按 GitHub 仓库筛选 |
| 视图 | 平均评分 | 单线汇总,或按评分器拆分查看 |
质量与规模#
报告分为两个互补视角:量级与成本(词量生成、Token 消耗、热门语言区域、术语表深度、变更速率)以及 质量(平均评分、术语覆盖率、指令遵循度)。质量类报告至少需要配置一个 AI reviewer。
