Prueba el mismo contenido con dos configuraciones de motor para evaluar un cambio antes de implementarlo.
El flujo de trabajo#
"Compara nuestro motor de producción con el motor de staging en estas 5 cadenas al japonés"
Qué sucede:
- El asistente localiza el contenido con ambos motores
- Presenta los resultados en una tabla comparativa
- Resalta las diferencias: "El motor de staging aplica el nuevo término del glosario para 'onboarding' (オンボーディング), mientras que producción sigue usando la localización descriptiva (導入手続き)"
Cuándo usar esto#
- Después de un ajuste: verifica que el cambio haya mejorado el resultado antes de promoverlo
- Evaluar cambios de modelo: misma configuración, distinto modelo principal
- Probar el impacto del glosario: con y sin términos nuevos
- Comparar motores para distintos casos de uso: contenido de marketing vs. contenido técnico
Ejemplos de comparación#
Antes y después de un ajuste#
"Localiza 'Welcome to your new workspace' al alemán con el motor A y el motor B"
Muestra si la entrada del glosario para "workspace" se conserva en el motor actualizado.
Evaluación de modelos#
"Cambié el modelo de japonés de GPT-4.1 a Claude Sonnet. Compara los resultados de estas 10 cadenas de UI."
La comparación lado a lado revela qué modelo resuelve mejor las cadenas cortas de UI frente a las descripciones más largas para tu dominio específico.
Pruebas de cobertura del glosario#
"Compara el motor con nuestro glosario completo de 200 términos frente a un motor nuevo sin glosario en estas cadenas legales"
Cuantifica cuánto aporta el glosario a la calidad del resultado para un tipo de contenido específico.
