SRT-субтитры

AI-перевод SRT-субтитров с помощью Lingo.dev CLI

Что такое SRT-субтитры?

SRT (SubRip) — это текстовый формат файлов, используемый для хранения субтитров к видео. Каждая запись субтитра содержит порядковый номер, временную метку и сам текст субтитра, что делает этот формат одним из самых популярных и поддерживаемых.

Например:

1
00:00:01,000 --> 00:00:03,500
Welcome to our product demo

2
00:00:04,000 --> 00:00:06,500
In this video, we'll show you
how to get started quickly

3
00:00:07,000 --> 00:00:09,500
First, navigate to your dashboard 📊

Что такое Lingo.dev CLI?

Lingo.dev CLI — это бесплатный open-source CLI для перевода приложений и контента с помощью ИИ. Он создан, чтобы заменить традиционные системы управления переводами и легко интегрируется в существующие пайплайны.

Подробнее см. в разделе Обзор.

О данном руководстве

В этом руководстве объясняется, как переводить SRT-субтитры с помощью Lingo.dev CLI.

Вы узнаете, как:

  • Создать проект с нуля
  • Настроить пайплайн перевода
  • Генерировать переводы с помощью ИИ

Необходимые условия

Для работы с Lingo.dev CLI убедитесь, что установлен Node.js v18+ :

❯ node -v
v22.17.0

Шаг 1. Создайте проект

В каталоге вашего проекта создайте файл i18n.json:

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {}
}

Этот файл определяет поведение пайплайна перевода, включая языки для перевода и расположение локализуемого контента в файловой системе.

Подробнее о доступных свойствах см. в разделе i18n.json.

Шаг 2. Настройте исходную локаль

Исходная локаль — это оригинальный язык и регион, на которых был написан ваш контент. Чтобы настроить исходную локаль, укажите свойство locale.source в файле i18n.json:

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {}
}

Исходная локаль должна быть указана в формате языкового тега BCP 47.

Полный список кодов локалей, поддерживаемых Lingo.dev CLI, смотрите в разделе Поддерживаемые коды локалей.

Шаг 3. Настройка целевых локалей

Целевые локали — это языки и регионы, на которые вы хотите перевести свой контент. Чтобы настроить целевые локали, укажите свойство locale.targets в файле i18n.json:

{
  "$schema": "https://lingo.dev/schema/i18n.json",
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {}
}

Шаг 4. Создайте исходный контент

Если вы ещё не сделали этого, создайте один или несколько SRT-файлов субтитров, содержащих переводимый контент. Эти файлы должны находиться по пути, в котором где-то встречается исходная локаль (например, в названии папки как en/ или в имени файла как messages.en.srt).

Шаг 5. Создайте bucket

  1. В файле i18n.json добавьте объект "srt" в объект buckets:

    {
      "$schema": "https://lingo.dev/schema/i18n.json",
      "version": "1.10",
      "locale": {
        "source": "en",
        "targets": ["es"]
      },
      "buckets": {
        "srt": {}
      }
    }
    
  2. В объекте "srt" определите массив из одного или нескольких паттернов include:

    {
      "$schema": "https://lingo.dev/schema/i18n.json",
      "version": "1.10",
      "locale": {
        "source": "en",
        "targets": ["es"]
      },
      "buckets": {
        "srt": {
          "include": ["./[locale]/example.srt"]
        }
      }
    }
    

    Эти паттерны определяют, какие файлы переводить.

    Сами паттерны:

    • должны содержать [locale] как плейсхолдер для выбранной локали
    • могут указывать на пути к файлам (например, "[locale]/video.srt")
    • могут использовать звёздочки как подстановочные знаки (например, "[locale]/*.srt")

    Рекурсивные glob-паттерны (например, **/*.srt) не поддерживаются.

Шаг 6. Настройте LLM

Lingo.dev CLI использует большие языковые модели (LLM) для AI-перевода контента. Чтобы использовать одну из этих моделей, вам нужен API-ключ от поддерживаемого провайдера.

Чтобы быстро начать работу, рекомендуем использовать Lingo.dev Engine — нашу облачную платформу с 10 000 бесплатных токенов в месяц:

  1. Зарегистрируйтесь в Lingo.dev.

  2. Выполните следующую команду:

    npx lingo.dev@latest login
    

    Это откроет ваш браузер по умолчанию и попросит пройти аутентификацию.

  3. Следуйте инструкциям на экране.

Шаг 7. Генерация переводов

В каталоге, где находится файл i18n.json, выполните следующую команду:

npx lingo.dev@latest run

Эта команда:

  1. Считывает файл i18n.json.
  2. Находит файлы, которые нужно перевести.
  3. Извлекает переводимый контент из файлов.
  4. Использует настроенную LLM для перевода извлечённого контента.
  5. Записывает переведённый контент обратно в файловую систему.

При первой генерации переводов создаётся файл i18n.lock. Этот файл отслеживает, какой контент уже переведён, чтобы избежать лишних повторных переводов при следующих запусках.

Пример

en/example.srt

1
00:00:01,000 --> 00:00:03,500
Welcome to our product demo

2
00:00:04,000 --> 00:00:06,500
In this video, we'll show you
how to get started quickly

3
00:00:07,000 --> 00:00:09,500
First, navigate to your dashboard 📊

4
00:00:10,000 --> 00:00:12,500
This process takes about 5 minutes

5
00:00:13,000 --> 00:00:15,500
Click the <i>Create New</i> button to begin

es/example.srt

1
00:00:01,000 --> 00:00:03,500
Bienvenido a nuestra demostración de producto

2
00:00:04,000 --> 00:00:06,500
En este video, te mostraremos
cómo empezar rápidamente

3
00:00:07,000 --> 00:00:09,500
Primero, navega a tu panel de control 📊

4
00:00:10,000 --> 00:00:12,500
Este proceso toma aproximadamente 5 minutos

5
00:00:13,000 --> 00:00:15,500
Haz clic en el botón <i>Crear Nuevo</i> para comenzar

i18n.json

{
  "version": "1.10",
  "locale": {
    "source": "en",
    "targets": ["es"]
  },
  "buckets": {
    "srt": {
      "include": ["./[locale]/example.srt"]
    }
  },
  "$schema": "https://lingo.dev/schema/i18n.json"
}

i18n.lock

version: 1
checksums:
  424142ee2f7c4f944722042f761b30eb:
    1#00:00:01,000-00:00:03,500: 5a2215cdfd6d9e9162efbdee57b89c27
    2#00:00:04,000-00:00:06,500: ecb7d6cb214b6db6d02e6e98cdfea178
    3#00:00:07,000-00:00:09,500: 3eee55196aea6ac13fb19eae7e7ffaf6
    4#00:00:10,000-00:00:12,500: a6cc802efe3431c7a986ac5d42d62ce1
    5#00:00:13,000-00:00:15,500: f73ef0a42ea51efb4e1e5fd2276ef243