SRT-субтитры
AI-перевод SRT-субтитров с помощью Lingo.dev CLI
Что такое SRT-субтитры?
SRT (SubRip) — это текстовый формат файлов, используемый для хранения субтитров к видео. Каждая запись субтитра содержит порядковый номер, временную метку и сам текст субтитра, что делает этот формат одним из самых популярных и поддерживаемых.
Например:
1
00:00:01,000 --> 00:00:03,500
Welcome to our product demo
2
00:00:04,000 --> 00:00:06,500
In this video, we'll show you
how to get started quickly
3
00:00:07,000 --> 00:00:09,500
First, navigate to your dashboard 📊
Что такое Lingo.dev CLI?
Lingo.dev CLI — это бесплатный open-source CLI для перевода приложений и контента с помощью ИИ. Он создан, чтобы заменить традиционные системы управления переводами и легко интегрируется в существующие пайплайны.
Подробнее см. в разделе Обзор.
О данном руководстве
В этом руководстве объясняется, как переводить SRT-субтитры с помощью Lingo.dev CLI.
Вы узнаете, как:
- Создать проект с нуля
- Настроить пайплайн перевода
- Генерировать переводы с помощью ИИ
Необходимые условия
Для работы с Lingo.dev CLI убедитесь, что установлен Node.js v18+ :
❯ node -v
v22.17.0
Шаг 1. Создайте проект
В каталоге вашего проекта создайте файл i18n.json:
{
"$schema": "https://lingo.dev/schema/i18n.json",
"version": "1.10",
"locale": {
"source": "en",
"targets": ["es"]
},
"buckets": {}
}
Этот файл определяет поведение пайплайна перевода, включая языки для перевода и расположение локализуемого контента в файловой системе.
Подробнее о доступных свойствах см. в разделе i18n.json.
Шаг 2. Настройте исходную локаль
Исходная локаль — это оригинальный язык и регион, на которых был написан ваш контент. Чтобы настроить исходную локаль, укажите свойство locale.source в файле i18n.json:
{
"$schema": "https://lingo.dev/schema/i18n.json",
"version": "1.10",
"locale": {
"source": "en",
"targets": ["es"]
},
"buckets": {}
}
Исходная локаль должна быть указана в формате языкового тега BCP 47.
Полный список кодов локалей, поддерживаемых Lingo.dev CLI, смотрите в разделе Поддерживаемые коды локалей.
Шаг 3. Настройка целевых локалей
Целевые локали — это языки и регионы, на которые вы хотите перевести свой контент. Чтобы настроить целевые локали, укажите свойство locale.targets в файле i18n.json:
{
"$schema": "https://lingo.dev/schema/i18n.json",
"version": "1.10",
"locale": {
"source": "en",
"targets": ["es"]
},
"buckets": {}
}
Шаг 4. Создайте исходный контент
Если вы ещё не сделали этого, создайте один или несколько SRT-файлов субтитров, содержащих переводимый контент. Эти файлы должны находиться по пути, в котором где-то встречается исходная локаль (например, в названии папки как en/ или в имени файла как messages.en.srt).
Шаг 5. Создайте bucket
-
В файле
i18n.jsonдобавьте объект"srt"в объектbuckets:{ "$schema": "https://lingo.dev/schema/i18n.json", "version": "1.10", "locale": { "source": "en", "targets": ["es"] }, "buckets": { "srt": {} } } -
В объекте
"srt"определите массив из одного или нескольких паттерновinclude:{ "$schema": "https://lingo.dev/schema/i18n.json", "version": "1.10", "locale": { "source": "en", "targets": ["es"] }, "buckets": { "srt": { "include": ["./[locale]/example.srt"] } } }Эти паттерны определяют, какие файлы переводить.
Сами паттерны:
- должны содержать
[locale]как плейсхолдер для выбранной локали - могут указывать на пути к файлам (например,
"[locale]/video.srt") - могут использовать звёздочки как подстановочные знаки (например,
"[locale]/*.srt")
Рекурсивные glob-паттерны (например,
**/*.srt) не поддерживаются. - должны содержать
Шаг 6. Настройте LLM
Lingo.dev CLI использует большие языковые модели (LLM) для AI-перевода контента. Чтобы использовать одну из этих моделей, вам нужен API-ключ от поддерживаемого провайдера.
Чтобы быстро начать работу, рекомендуем использовать Lingo.dev Engine — нашу облачную платформу с 10 000 бесплатных токенов в месяц:
-
Выполните следующую команду:
npx lingo.dev@latest loginЭто откроет ваш браузер по умолчанию и попросит пройти аутентификацию.
-
Следуйте инструкциям на экране.
Шаг 7. Генерация переводов
В каталоге, где находится файл i18n.json, выполните следующую команду:
npx lingo.dev@latest run
Эта команда:
- Считывает файл
i18n.json. - Находит файлы, которые нужно перевести.
- Извлекает переводимый контент из файлов.
- Использует настроенную LLM для перевода извлечённого контента.
- Записывает переведённый контент обратно в файловую систему.
При первой генерации переводов создаётся файл i18n.lock. Этот файл отслеживает, какой контент уже переведён, чтобы избежать лишних повторных переводов при следующих запусках.
Пример
en/example.srt
1
00:00:01,000 --> 00:00:03,500
Welcome to our product demo
2
00:00:04,000 --> 00:00:06,500
In this video, we'll show you
how to get started quickly
3
00:00:07,000 --> 00:00:09,500
First, navigate to your dashboard 📊
4
00:00:10,000 --> 00:00:12,500
This process takes about 5 minutes
5
00:00:13,000 --> 00:00:15,500
Click the <i>Create New</i> button to begin
es/example.srt
1
00:00:01,000 --> 00:00:03,500
Bienvenido a nuestra demostración de producto
2
00:00:04,000 --> 00:00:06,500
En este video, te mostraremos
cómo empezar rápidamente
3
00:00:07,000 --> 00:00:09,500
Primero, navega a tu panel de control 📊
4
00:00:10,000 --> 00:00:12,500
Este proceso toma aproximadamente 5 minutos
5
00:00:13,000 --> 00:00:15,500
Haz clic en el botón <i>Crear Nuevo</i> para comenzar
i18n.json
{
"version": "1.10",
"locale": {
"source": "en",
"targets": ["es"]
},
"buckets": {
"srt": {
"include": ["./[locale]/example.srt"]
}
},
"$schema": "https://lingo.dev/schema/i18n.json"
}
i18n.lock
version: 1
checksums:
424142ee2f7c4f944722042f761b30eb:
1#00:00:01,000-00:00:03,500: 5a2215cdfd6d9e9162efbdee57b89c27
2#00:00:04,000-00:00:06,500: ecb7d6cb214b6db6d02e6e98cdfea178
3#00:00:07,000-00:00:09,500: 3eee55196aea6ac13fb19eae7e7ffaf6
4#00:00:10,000-00:00:12,500: a6cc802efe3431c7a986ac5d42d62ce1
5#00:00:13,000-00:00:15,500: f73ef0a42ea51efb4e1e5fd2276ef243