Ao migrar de um fornecedor legado de localização ou de um TMS, é bem provável que você tenha glossários, bases terminológicas ou exportações de memória de tradução em arquivos TMX, CSV ou TBX. Seu assistente de IA pode fazer o parse desses arquivos e alimentar diretamente a configuração do seu engine de localização.
O workflow#
"Aqui está a exportação do nosso glossário (CSV). Importe para o glossário do nosso engine para todos os idiomas."
O que acontece:
- O assistente lê a estrutura do CSV — identifica as colunas de termo de origem, localização de destino, idioma e tipo de termo
- Mapeia cada linha para uma entrada de glossário: texto de origem, texto de destino, par de idiomas e se é uma localização personalizada ou um termo não traduzível
- Mostra o plano de importação: "147 termos encontrados em 6 idiomas. 12 estão marcados como não traduzir, 135 são localizações obrigatórias."
- Após a aprovação, cria todas as entradas de glossário via MCP
- Informa: "147 entradas de glossário criadas. 3 duplicadas ignoradas."
Formatos compatíveis#
| Formato | O que contém | Como fornecer |
|---|---|---|
| CSV / TSV | Bases terminológicas, glossários, listas bilíngues simples | Cole o conteúdo ou descreva a estrutura do arquivo |
| TMX | Memória de tradução — pares de segmentos de origem e destino com metadados | Cole uma amostra representativa ou descreva a estrutura |
| TBX | Bancos de dados terminológicos — entradas estruturadas de termos com definições | Cole o conteúdo ou descreva o esquema |
| Exportações do Excel | Exportações de glossário ou guia de estilo específicas do fornecedor | Descreva as colunas e cole linhas representativas |
Passo a passo: importação de TMX#
Arquivos TMX de fornecedores legados contêm pares de segmentos que podem alimentar tanto entradas de glossário quanto instruções.
"Aqui está uma exportação TMX do nosso fornecedor anterior. Ela tem 500 unidades de tradução para en → de. Extraia qualquer terminologia recorrente como entradas de glossário."
O que acontece:
- O assistente faz o parse da estrutura do TMX — identifica segmentos de origem, segmentos de destino e pares de idiomas
- Agrupa termos recorrentes — palavras ou frases que aparecem 3+ vezes com localizações consistentes
- Propõe entradas de glossário para termos com localizações estáveis: "'privacy policy' → 'Datenschutzerklärung' (aparece 12 vezes, sempre localizado dessa forma)"
- Identifica padrões que devem virar instruções: "Substantivos compostos sempre levam hífen neste corpus — adicionar como instrução para
de?" - Mostra o plano completo para revisão
- Aplica após aprovação
Passo a passo: importação de glossário em CSV#
A maioria das plataformas legadas de localização exporta glossários em CSV, com colunas para origem, destino, idioma e notas.
"Importe este CSV para o nosso engine. Colunas: source_term, target_term, locale, type (localize/do-not-translate), notes."
O que acontece:
- O assistente lê o mapeamento das colunas
- Cria entradas de glossário: linhas
localizeviram localizações personalizadas, linhasdo-not-translateviram entradas não traduzíveis - Entradas com notas que descrevem regras (e não apenas definições) são sinalizadas como possíveis instruções: "A nota para 'date format' diz 'Sempre use DD.MM.YYYY em alemão' — adicionar como instrução para
de?" - Mostra o plano e aplica após aprovação
O que importar vs. o que deixar para trás#
| Importar como glossário | Importar como instrução | Ignorar |
|---|---|---|
| Nomes de marca (não traduzíveis) | Regras de formatação (data, número, moeda) | Correspondências de TM aproximadas abaixo de 95% |
| Terminologia de produto (localizações obrigatórias) | Convenções de pontuação | Pares de segmentos dependentes de contexto |
| Termos jurídicos (localizações obrigatórias) | Regras de registro/formalidade | Localizações pontuais que não são terminologia |
| Rótulos de UI com localizações obrigatórias | Regras de capitalização | Segmentos com mais de 2-3 frases |
Depois da importação#
- Verifique — execute um teste de localização com conteúdo que use os termos importados
- Revise — faça uma verificação por amostragem em um lote com o novo glossário para confirmar a aplicação
- Ajuste — ajuste entradas que não geram a saída correta no contexto
Dicas para importações grandes#
- Comece pelos termos mais frequentes. Uma exportação de TM com 5.000 entradas não é um glossário — é um corpus. Peça ao assistente para extrair apenas os termos que aparecem 3+ vezes.
- Importe em lotes por idioma. É muito mais fácil revisar 50 termos em alemão do que 500 termos em 10 idiomas.
- Use a coluna de notas. Se sua exportação tiver notas do tradutor, o assistente pode transformar padrões em instruções.
- Não importe TM no nível de frase como glossário. Entradas de glossário são termos e frases curtas. Frases completas pertencem ao material de referência, não ao glossário.
