机器翻译已经能提供很强的第一版。对很多内容来说,这一步就够了。但有些内容在发布前还需要更多处理:先清掉源文本里的错别字,再让人工译者参与审核,让文案读起来像母语者亲笔所写,或检查内容往返翻译后语义是否依然完整保留。
这些步骤你当然也可以自己拼——先调用翻译,再跑一遍语法检查,把结果交给审核者,等他们反馈,再回译检查语义偏差,最后协调各处差异。翻译本身反而是最简单的部分。真正难的是把这些步骤之间的等待、顺序和失败处理编排好——而最难的,莫过于一个两天后才回复的审核者。
这条流水线,就是把这些步骤提前接好。每个阶段都是围绕核心翻译步骤的可选包装,可在 本地化引擎 上按需开启(也可以按请求覆盖),并且统一运行在持久化异步任务内部,由它负责重试和失败隔离。你来选择需要哪些阶段;平台按顺序执行,并记录整个过程。这个集群最终希望留给你的只有一个结论:只为翻译步骤包裹你真正需要的那些阶段。
仅支持异步 API
流水线阶段只适用于通过 Async Localization API 创建的任务。同步的 /localize endpoint 只运行核心翻译步骤,不包含其他阶段——引擎上的任何流水线配置都会被忽略。人工审核阶段需要一个可以暂停两天的工作流;单次请求/响应调用根本无处承载这样的等待。流水线只存在于任务可持久化的地方。
本页内容
为什么需要流水线#
原始翻译并不会区分自己正在处理什么类型的内容。法律文本需要尽量逐字忠实于原文。营销文案则希望读起来像母语者原创,而不是“翻译腔”。用户生成的源文本,往往需要先清理错别字和语病,避免源文本中的一个错误污染所有目标语言版本。受监管内容,则需要由具备资质的人工审核者签字确认。
这些是完全不同的任务,而流水线让同一个引擎通过组合阶段来完成它们,而不是被迫采用单一模式。什么都不开启,你得到的就是纯翻译。开启人工审核阶段,任务就会暂停等待你的团队。开启改写阶段,输出就会被重写得更自然、更地道。下面每个阶段页面都会明确说明它适用于什么内容——也同样清楚地说明它不适用于什么内容,避免你启用一个与目标背道而驰的阶段。
你可以在引擎的 Pipeline 标签页里一次性配置默认值,也可以在单次提交请求中通过 pipelineConfig 对象覆盖——未显式提供的阶段会继承引擎设置。两层配置的具体机制见 配置流水线。
阶段一览#
流水线包裹在核心本地化步骤之外。你可以启用任意组合的阶段,但执行顺序固定如下。未启用的阶段会被完全跳过。每个阶段都有独立页面,详细说明其完整行为、失败方式,以及如何调用启用。
核心本地化
始终执行。你的引擎会应用其 model config、glossary、brand voice 和 instructions 来生成译文。这是唯一不能关闭的阶段——其他所有阶段都只是围绕它展开。
本地化后人工审核
可选。由人工审核译文——可以是你自己的团队在 dashboard 中审核(Internal Review),也可以是外部服务商的专业译者(External Review)。任务会通过事件驱动的等待机制暂停,直到他们提交结果,因此即使审核耗时很久,等待期间也不会消耗计算资源。参见 Human review。
本地化后 AI 审核
可选,并且只会在人工审核产出结果后运行。AI agent 会将人工修改与你引擎的 glossary、brand voice 和 instructions 重新协调统一。它不同于 AI Reviewers,后者只负责质量评分,不会改动文本。参见 AI review。
改写为自然文案
可选。AI agent 会在保留原意、占位符和标签的前提下,将译文改写成目标语言中自然、地道的文案。非关键阶段。适用于营销文案;如果内容更强调字面准确,就应跳过。参见 Rephrase for natural copy。
回译检查
可选。系统会先将输出回译成源语言,再由 AI 与原文比对,并将语义偏差标记为 minor、major 或 critical——其中 major 和 critical 问题会被自动修正。这是经典人工 QA 方法的自动化版本。参见 Back-translation check。
阶段失败后,任务会怎样#
面对一条六阶段流水线,一个很自然的疑问是:每多加一个阶段,就多一个可能出错的环节——那启用更多阶段,会不会让任务更容易失败?不会。非关键阶段的失败不会导致任务失败。预编辑和改写都属于非关键阶段:如果其中任一失败,系统会沿用上一份可用输出继续往下执行。任务会降级为警告状态,而不是直接中断;同时,每个已启用阶段都会留下可回查的记录,让你准确看到到底运行了哪些步骤。
这就是整条流水线的核心形态:只为翻译步骤包裹你真正需要的那些阶段,把它们放进一个本就负责处理失败的任务里运行,并为每个阶段保留一份记录。关于降级任务如何上报,以及逐阶段的检查界面,见 Observe pipeline runs。下面这些页面对应的就是各个阶段本身——从最符合你当前内容类型的那个开始看即可。
