|
Документация
Заказать демоПлатформа
ПлатформаMCP
CLIAPIПроцессы
РуководстваЖурнал изменений

Начало работы

  • Как это работает
  • Настройка
  • Возможности

Рабочие процессы

  • Создать движок
  • Импорт глоссария
  • Локализация контента
  • Проверка запросов
  • Диагностика
  • Настроить движок
  • Выборочная проверка
  • Сравнить движки
  • Добавить локаль

Импорт из устаревших систем и от прежних подрядчиков

Если вы переходите с устаревшего поставщика локализации или TMS, у вас, скорее всего, уже есть глоссарии, терминологические базы или экспорты памяти переводов в файлах TMX, CSV или TBX. AI-ассистент может разобрать их и сразу заполнить конфигурацию вашего движка локализации.

Как устроен рабочий процесс#

"Вот экспорт нашего глоссария (CSV). Импортируй его в глоссарий нашего движка для всех локалей."

Что происходит:

  1. Ассистент считывает структуру CSV — определяет столбцы с исходным термином, целевой локализацией, локалью и типом термина
  2. Преобразует каждую строку в запись глоссария: исходный текст, целевой текст, пара локалей и признак того, является ли это пользовательской локализацией или непереводимым термином
  3. Показывает план импорта: "Найдено 147 терминов для 6 локалей. 12 помечены как do-not-translate, 135 — как обязательные локализации."
  4. После подтверждения создаёт все записи глоссария через MCP
  5. Сообщает: "Создано 147 записей глоссария. 3 дубликата пропущены."

Поддерживаемые форматы#

ФорматЧто внутриКак передать
CSV / TSVТерминологические базы, глоссарии, простые двуязычные спискиВставьте содержимое или опишите структуру файла
TMXПамять переводов — пары исходных и целевых сегментов с метаданнымиВставьте репрезентативный фрагмент или опишите структуру
TBXТерминологические базы — структурированные записи терминов с определениямиВставьте содержимое или опишите схему
Экспорт из ExcelЭкспорт глоссариев или гайдов по стилю в формате конкретного поставщикаОпишите столбцы и вставьте несколько репрезентативных строк

Пошагово: импорт TMX#

TMX-файлы от прежних поставщиков содержат пары сегментов, которые можно использовать и для глоссария, и для инструкций.

"Вот TMX-экспорт от нашего предыдущего подрядчика. В нём 500 единиц перевода для en → de. Извлеки повторяющуюся терминологию и оформи её как записи глоссария."

Что происходит:

  1. Ассистент разбирает структуру TMX — определяет исходные сегменты, целевые сегменты и пары локалей
  2. Группирует повторяющиеся термины — слова или фразы, которые встречаются 3+ раза с устойчивыми локализациями
  3. Предлагает записи глоссария для терминов со стабильными локализациями: "'privacy policy' → 'Datenschutzerklärung' (встречается 12 раз и каждый раз локализуется так)"
  4. Выявляет паттерны, которые стоит превратить в инструкции: "Сложные существительные в этом корпусе всегда пишутся через дефис — добавить это как инструкцию для de?"
  5. Показывает полный план для проверки
  6. Применяет после подтверждения

Пошагово: импорт глоссария из CSV#

Большинство устаревших платформ локализации экспортируют глоссарии в CSV со столбцами для исходного термина, перевода, локали и примечаний.

"Импортируй этот CSV в наш движок. Столбцы: source_term, target_term, locale, type (localize/do-not-translate), notes."

Что происходит:

  1. Ассистент считывает сопоставление столбцов
  2. Создаёт записи глоссария: строки localize становятся пользовательскими локализациями, а строки do-not-translate — непереводимыми записями
  3. Записи с примечаниями, где описаны правила, а не только определения, помечаются как потенциальные инструкции: "В примечании для 'date format' сказано 'Always use DD.MM.YYYY in German' — добавить это как инструкцию для de?"
  4. Показывает план и применяет после подтверждения

Что импортировать, а что оставить#

Импортировать в глоссарийИмпортировать как инструкциюПропустить
Названия брендов (непереводимые)Правила форматирования (дата, числа, валюта)Нечёткие совпадения TM ниже 95%
Терминология продукта (обязательные локализации)Правила пунктуацииПары сегментов, зависящие от контекста
Юридические термины (обязательные локализации)Правила регистра и формальностиРазовые локализации, не относящиеся к терминологии
UI-метки с обязательными локализациямиПравила использования заглавных буквСегменты длиннее 2-3 предложений

После импорта#

  1. Проверьте — запустите localization test на контенте, где используются импортированные термины
  2. Проверка — выборочно проверьте набор строк по новому глоссарию, чтобы убедиться, что он применяется
  3. Настройте — скорректируйте записи, которые не дают нужного результата в контексте

Советы для крупных импортов#

  • Начинайте с самых частотных терминов. TM-экспорт на 5 000 записей — это не глоссарий, а корпус. Попросите ассистента извлечь только те термины, которые встречаются 3+ раза.
  • Импортируйте партиями по локалям. Проверить 50 немецких терминов гораздо проще, чем 500 терминов сразу для 10 локалей.
  • Используйте столбец с примечаниями. Если в экспорте есть примечания переводчика, ассистент может превратить повторяющиеся паттерны в инструкции.
  • Не импортируйте TM на уровне предложений в глоссарий. Записи глоссария — это термины и короткие фразы. Полные предложения должны храниться в справочных материалах, а не в глоссарии.

Эта страница была полезной?

Max PrilutskiyMax Prilutskiy·Обновлено 4 дня назад·3 минуты чтения