Prueba el mismo contenido con dos configuraciones de motor para evaluar un cambio antes de aplicarlo definitivamente.
El flujo de trabajo#
"Compara nuestro motor de producción con el motor de staging en estas 5 cadenas para japonés"
Qué ocurre:
- El asistente localiza el contenido con ambos motores
- Presenta los resultados en una tabla comparativa
- Destaca las diferencias: "El motor de staging aplica el nuevo término del glosario para 'onboarding' (オンボーディング), mientras que el de producción sigue usando la localización descriptiva (導入手続き)"
Cuándo usarlo#
- Después de un ajuste: comprueba que el cambio ha mejorado el resultado antes de promocionarlo
- Evaluar cambios de modelo: misma configuración, distinto modelo principal
- Probar el impacto del glosario: con y sin términos nuevos
- Comparar motores para distintos casos de uso: contenido de marketing frente a contenido técnico
Ejemplos de comparaciones#
Antes y después de un ajuste#
"Localiza 'Welcome to your new workspace' al alemán con el motor A y el motor B"
Muestra si la entrada del glosario para "workspace" se conserva en el motor actualizado.
Evaluación de modelos#
"He cambiado el modelo de japonés de GPT-4.1 a Claude Sonnet. Compara los resultados de estas 10 cadenas de interfaz."
La comparación codo con codo revela qué modelo resuelve mejor las cadenas cortas de interfaz frente a las descripciones más largas en tu dominio concreto.
Pruebas de cobertura del glosario#
"Compara el motor con nuestro glosario completo de 200 términos con un motor nuevo sin glosario en estas cadenas legales"
Cuantifica hasta qué punto el glosario contribuye a la calidad del resultado en un tipo de contenido concreto.
