Если вы переходите с устаревшего поставщика локализации или TMS, у вас, скорее всего, уже есть глоссарии, терминологические базы или экспорты памяти переводов в файлах TMX, CSV или TBX. AI-ассистент может разобрать их и сразу заполнить конфигурацию вашего движка локализации.
Как устроен рабочий процесс#
"Вот экспорт нашего глоссария (CSV). Импортируй его в глоссарий нашего движка для всех локалей."
Что происходит:
- Ассистент считывает структуру CSV — определяет столбцы с исходным термином, целевой локализацией, локалью и типом термина
- Преобразует каждую строку в запись глоссария: исходный текст, целевой текст, пара локалей и признак того, является ли это пользовательской локализацией или непереводимым термином
- Показывает план импорта: "Найдено 147 терминов для 6 локалей. 12 помечены как do-not-translate, 135 — как обязательные локализации."
- После подтверждения создаёт все записи глоссария через MCP
- Сообщает: "Создано 147 записей глоссария. 3 дубликата пропущены."
Поддерживаемые форматы#
| Формат | Что внутри | Как передать |
|---|---|---|
| CSV / TSV | Терминологические базы, глоссарии, простые двуязычные списки | Вставьте содержимое или опишите структуру файла |
| TMX | Память переводов — пары исходных и целевых сегментов с метаданными | Вставьте репрезентативный фрагмент или опишите структуру |
| TBX | Терминологические базы — структурированные записи терминов с определениями | Вставьте содержимое или опишите схему |
| Экспорт из Excel | Экспорт глоссариев или гайдов по стилю в формате конкретного поставщика | Опишите столбцы и вставьте несколько репрезентативных строк |
Пошагово: импорт TMX#
TMX-файлы от прежних поставщиков содержат пары сегментов, которые можно использовать и для глоссария, и для инструкций.
"Вот TMX-экспорт от нашего предыдущего подрядчика. В нём 500 единиц перевода для en → de. Извлеки повторяющуюся терминологию и оформи её как записи глоссария."
Что происходит:
- Ассистент разбирает структуру TMX — определяет исходные сегменты, целевые сегменты и пары локалей
- Группирует повторяющиеся термины — слова или фразы, которые встречаются 3+ раза с устойчивыми локализациями
- Предлагает записи глоссария для терминов со стабильными локализациями: "'privacy policy' → 'Datenschutzerklärung' (встречается 12 раз и каждый раз локализуется так)"
- Выявляет паттерны, которые стоит превратить в инструкции: "Сложные существительные в этом корпусе всегда пишутся через дефис — добавить это как инструкцию для
de?" - Показывает полный план для проверки
- Применяет после подтверждения
Пошагово: импорт глоссария из CSV#
Большинство устаревших платформ локализации экспортируют глоссарии в CSV со столбцами для исходного термина, перевода, локали и примечаний.
"Импортируй этот CSV в наш движок. Столбцы: source_term, target_term, locale, type (localize/do-not-translate), notes."
Что происходит:
- Ассистент считывает сопоставление столбцов
- Создаёт записи глоссария: строки
localizeстановятся пользовательскими локализациями, а строкиdo-not-translate— непереводимыми записями - Записи с примечаниями, где описаны правила, а не только определения, помечаются как потенциальные инструкции: "В примечании для 'date format' сказано 'Always use DD.MM.YYYY in German' — добавить это как инструкцию для
de?" - Показывает план и применяет после подтверждения
Что импортировать, а что оставить#
| Импортировать в глоссарий | Импортировать как инструкцию | Пропустить |
|---|---|---|
| Названия брендов (непереводимые) | Правила форматирования (дата, числа, валюта) | Нечёткие совпадения TM ниже 95% |
| Терминология продукта (обязательные локализации) | Правила пунктуации | Пары сегментов, зависящие от контекста |
| Юридические термины (обязательные локализации) | Правила регистра и формальности | Разовые локализации, не относящиеся к терминологии |
| UI-метки с обязательными локализациями | Правила использования заглавных букв | Сегменты длиннее 2-3 предложений |
После импорта#
- Проверьте — запустите localization test на контенте, где используются импортированные термины
- Проверка — выборочно проверьте набор строк по новому глоссарию, чтобы убедиться, что он применяется
- Настройте — скорректируйте записи, которые не дают нужного результата в контексте
Советы для крупных импортов#
- Начинайте с самых частотных терминов. TM-экспорт на 5 000 записей — это не глоссарий, а корпус. Попросите ассистента извлечь только те термины, которые встречаются 3+ раза.
- Импортируйте партиями по локалям. Проверить 50 немецких терминов гораздо проще, чем 500 терминов сразу для 10 локалей.
- Используйте столбец с примечаниями. Если в экспорте есть примечания переводчика, ассистент может превратить повторяющиеся паттерны в инструкции.
- Не импортируйте TM на уровне предложений в глоссарий. Записи глоссария — это термины и короткие фразы. Полные предложения должны храниться в справочных материалах, а не в глоссарии.
