CSV

AI-перевод CSV-файлов с помощью Lingo.dev CLI

Что такое CSV?

CSV (Comma-Separated Values, значения, разделённые запятыми) — это текстовый формат файлов для хранения табличных данных, где каждая строка — это отдельная запись, а значения в строке разделяются запятыми.

Например:

KEY,en
welcome_message,Welcome to our application
button_save,Save
error_invalid_email,Please enter a valid email address

Что такое Lingo.dev CLI?

Lingo.dev CLI — это бесплатный open-source CLI для перевода приложений и контента с помощью ИИ. Он создан, чтобы заменить традиционные системы управления переводами и легко интегрируется в существующие пайплайны.

Подробнее см. в разделе Обзор.

О данном руководстве

В этом гайде рассказывается, как переводить CSV-файлы с помощью Lingo.dev CLI.

Вы узнаете, как:

  • Создать проект с нуля
  • Настроить пайплайн перевода
  • Генерировать переводы с помощью ИИ

Необходимые условия

Для работы с Lingo.dev CLI убедитесь, что установлен Node.js v18+:

❯ node -v
v22.17.0

Шаг 1. Создайте проект

В директории вашего проекта создайте файл i18n.json:

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {}
}

Этот файл определяет поведение пайплайна перевода: какие языки использовать и где на файловой системе находится контент для локализации.

Подробнее о доступных свойствах см. в разделе i18n.json.

Шаг 2. Настройте исходную локаль

Исходная локаль — это оригинальный язык и регион, на которых написан ваш контент. Чтобы её настроить, укажите свойство locale.source в файле i18n.json:

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {}
}

Исходная локаль должна быть указана в формате BCP 47 language tag.

Полный список кодов локалей, поддерживаемых Lingo.dev CLI, смотрите в разделе Поддерживаемые коды локалей.

Шаг 3. Настройте целевые локали

Целевые локали — это языки и регионы, на которые вы хотите перевести свой контент. Чтобы настроить целевые локали, укажите свойство locale.targets в файле i18n.json:

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {}
}

Шаг 4. Создайте исходный контент

Если вы ещё не сделали этого, создайте CSV-файл с контентом для перевода.

Для CSV-файлов действуют следующие требования:

  • Первый столбец должен называться «KEY».
  • Каждая строка в столбце «KEY» должна содержать уникальные идентификаторы для переводимых сообщений.
  • Второй столбец должен соответствовать исходной локали, определённой в файле i18n.json.
  • Каждая строка во втором столбце должна содержать контент для перевода.

Примечание: В процессе перевода исходные файлы контента будут перезаписаны, чтобы включить переведённый контент (в дополнение к исходному).

Шаг 5. Создайте bucket

  1. В файле i18n.json добавьте объект "csv" в объект buckets:

    {
      "$schema": "https://lingo.dev/schema/i18n.json",
      "version": "1.10",
      "locale": {
        "source": "en",
        "targets": ["es"]
      },
      "buckets": {
        "csv": {}
      }
    }
    
  2. В объекте "csv" определите массив из одного или нескольких шаблонов include:

    {
      "$schema": "https://lingo.dev/schema/i18n.json",
      "version": "1.10",
      "locale": {
        "source": "en",
        "targets": ["es"]
      },
      "buckets": {
        "csv": {
          "include": ["./example.csv"]
        }
      }
    }
    

    Эти шаблоны определяют, какие файлы переводить, и могут:

    • указывать на конкретные пути к файлам (например, "some/dir/file.csv")
    • использовать звёздочки как подстановочные знаки (например, "some/dir/*.csv")

    Рекурсивные glob-шаблоны (например, **/*.csv) не поддерживаются.

Шаг 6. Настройте LLM

Lingo.dev CLI использует большие языковые модели (LLM) для перевода контента с помощью ИИ. Чтобы использовать одну из этих моделей, вам понадобится API-ключ от поддерживаемого провайдера.

Чтобы начать как можно быстрее, рекомендуем использовать Lingo.dev Engine — нашу собственную облачную платформу, которая предоставляет 10 000 токенов бесплатного использования каждый месяц:

  1. Зарегистрируйтесь в Lingo.dev.

  2. Выполните следующую команду:

    npx lingo.dev@latest login
    

    Откроется ваш браузер по умолчанию и появится запрос на аутентификацию.

  3. Следуйте инструкциям на экране.

Шаг 7. Генерация переводов

В каталоге, где находится файл i18n.json, выполните следующую команду:

npx lingo.dev@latest run

Эта команда:

  1. Считывает файл i18n.json.
  2. Находит файлы, которые нужно перевести.
  3. Извлекает переводимый контент из файлов.
  4. Использует настроенную LLM для перевода извлечённого контента.
  5. Записывает переведённый контент обратно в файловую систему.

При первой генерации переводов создаётся файл i18n.lock. В нём хранится информация о переведённом контенте, чтобы избежать лишних повторных переводов при следующих запусках.

Пример

example.csv (до перевода)

KEY,en
welcome_message,Welcome to our application
button_save,Save
error_invalid_email,Please enter a valid email address
product_name,Premium Widget
empty_row_key,
whitespace_only,
new_feature,This is a new feature

example.csv (после перевода)

KEY,en,es
welcome_message,Welcome to our application,Bienvenido a nuestra aplicación
button_save,Save,Guardar
error_invalid_email,Please enter a valid email address,"Por favor, introduce una dirección de correo electrónico válida"
product_name,Premium Widget,Widget Premium
empty_row_key,,
whitespace_only,   ,
new_feature,This is a new feature,Esta es una nueva función

i18n.json

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {
    "csv": {
      "include": ["./example.csv"]
    }
  }
}

i18n.lock

version: 1
checksums:
  e8b273672f895de0944f0a2317670d7c:
    welcome_message: 1308168cca4fa5d8d7a0cf24e55e93fc
    button_save: f7a2929f33bc420195e59ac5a8bcd454
    error_invalid_email: 8de4bc8832b11b380bc4cbcedc16e48b
    product_name: d3d99b147cc363dc6db8a48e8a13d4c1
    new_feature: 7cd986af1fe5e89abe7ecffba5413110
  d0f33bd41270762260010c4723a564f5:
    welcome_message: 1308168cca4fa5d8d7a0cf24e55e93fc
    button_save: f7a2929f33bc420195e59ac5a8bcd454
    error_invalid_email: 8de4bc8832b11b380bc4cbcedc16e48b
    product_name: d3d99b147cc363dc6db8a48e8a13d4c1
    new_feature: 7cd986af1fe5e89abe7ecffba5413110