Teste o mesmo conteúdo em duas configurações de motor para avaliar uma alteração antes de a aplicar.
O workflow#
"Compare o nosso motor de produção com o motor de staging nestas 5 strings para japonês"
O que acontece:
- O assistente localiza o conteúdo com ambos os motores
- Apresenta os resultados numa tabela lado a lado
- Destaca as diferenças: "O motor de staging aplica o novo termo de glossário para 'onboarding' (オンボーディング), enquanto a produção continua a usar a localização descritiva (導入手続き)"
Quando utilizar#
- Depois de um ajuste — confirme se a alteração melhorou o resultado antes de a promover
- Avaliar alterações de modelo — mesma configuração, modelo principal diferente
- Testar o impacto do glossário — com e sem termos novos
- Comparar motores para diferentes casos de uso — conteúdo de marketing vs. conteúdo técnico
Exemplos de comparação#
Antes/depois de um ajuste#
"Localize 'Welcome to your new workspace' para alemão com o motor A e o motor B"
Mostra se a entrada de glossário para "workspace" está a ser preservada no motor atualizado.
Avaliação de modelos#
"Mudei o modelo de japonês de GPT-4.1 para Claude Sonnet. Compare os resultados destas 10 strings de UI."
A comparação lado a lado revela qual dos modelos lida melhor com strings curtas de UI versus descrições mais longas, no seu domínio específico.
Teste de profundidade do glossário#
"Compare o motor com o nosso glossário completo de 200 termos com um motor novo, sem glossário, nestas strings jurídicas"
Quantifica o contributo do glossário para a qualidade do resultado num tipo de conteúdo específico.
