ローカライゼーションエンジニアリングプラットフォーム

Lingo.devは、AIを活用したローカライゼーションエンジニアリングプラットフォームです。プロダクトチームがLLMをステートフルな翻訳APIへと変え、あらゆる言語のアプリ、ドキュメント、コンテンツに一貫性のある本番品質の翻訳を実装できるよう支援します。

コンテキストとローカライゼーションエンジニアリング#

翻訳にLLMを使うこと自体は、もはや当たり前です。どんなチームでも文字列をモデルに送れば、翻訳結果は返ってきます。ですが、翻訳を完璧にする要素は2つあります。コンテキストとローカライゼーションエンジニアリングです。

コンテキストとは、文字列そのもの以外でモデルが把握している情報のことです。たとえば、プロダクト、対象ユーザー、ブランドボイス、ロケールごとの表現慣習。これがなければ、モデルは推測します。これがあれば、モデルはローカライズします。

ローカライゼーションエンジニアリングとは、そのコンテキストを再現可能なインフラとして組み込む実践です。用語集のルール、文体の好み、文化的な調整などを定義し、どの翻訳でも、あらゆるロケールで一貫して適用できるようにします。

この2つがなければ、得られるのは翻訳止まりです。この2つがあって初めて、ローカライゼーションになります。

課題#

LLM以前、チームにあった選択肢は2つ。しかも、どちらにも欠点がありました。

機械翻訳は高速でしたが、プロダクトの文脈を理解するには構造的な限界がありました。チームは、あらゆる市場で信頼を損なうと分かっていながら、MTの出力をそのままリリースしていました。

手動翻訳は正確でしたが、スケールは線形でした。新しいロケールが増えるたびに、言語担当者にプロダクト用語、ブランドボイス、ドメイン知識をトレーニングする必要がありました。42言語で1億語超を処理した結果、ローカライゼーションの遅延の89%は翻訳そのものではなく、チーム間の引き継ぎで発生していることが分かりました。

どちらもローカライゼーションをプロジェクト管理のワークフローとして扱っていました。Lingo.devは、それをエンジニアリング課題として扱います。

構築するもの#

Lingo.devでは、チームが独自のローカライゼーションエンジンを構築します。各エンジンは、次の要素で構成されます。

ロケールごとのLLMモデル - 優先順位付きのフォールバックを備え、各言語ペアに最適なモデルを選べます。
ブランドボイス - 言語ごとに、プロダクトがどう話すかを定義します。ドイツ語ではフォーマルな「Sie」、イタリア語ではカジュアルな「tu」、フランス語では丁寧な「vous」。
Glossary - ソース用語をロケールごとの正確な訳語にマッピングします。たとえば「911」はヨーロッパ市場では「112」になります。製品名は翻訳しません。
Instructions - 汎用モデルが見落としがちな言語ルールを組み込みます。スペイン語での形容詞の位置、パーセント記号の前のスペース、市場ごとの代名詞の丁寧さなどです。
品質スコアリング - GEMBAスコア、BERTScore、用語集準拠、ロケール固有のバリデーター。継続的かつ自動で実行されます。

その結果、チームは自社ならではの知見や判断基準に、2023年から続くLingo.devの言語エンジニアリング研究を掛け合わせることで、自分たちが話せない言語でも、初日から予測可能なかたちでグローバル展開を進められます。

オープンソースの開発者ツール#

Lingo.devのオープンソースコミュニティ（GitHubスター5,100超）は、コードベースをローカライゼーションエンジンにつなぐ開発者向けツールを構築しています。

CLI - コマンドラインから翻訳。インストールから最初の翻訳済みビルドまで、わずか4分。
CI/CD - GitHub Actions、GitLab CI、Bitbucket Pipelines。コードと一緒に翻訳もリリースできます。
Compiler - ビルド時i18n。ランタイムのオーバーヘッドも、レイアウトシフトもありません。
I18n MCP - Claude Code、Cursor、GitHub CopilotなどのAIコーディングアシスタントにローカライゼーションの文脈を提供します。

次のステップ#

ローカライゼーションエンジン

エンジンがモデル、用語集、ブランドボイス、スコアリングをどう組み合わせるかを見る

AI評価者

翻訳品質の自動モニタリングを設定する

CLI クイックスタート

CLIをインストールして、最初の翻訳を実行する

APIリファレンス

ローカライゼーションAPIをワークフローに統合する

ロケールごとのLLMモデル - 優先順位付きのフォールバックを備え、各言語ペアに最適なモデルを選べます。
ブランドボイス - 言語ごとに、プロダクトがどう話すかを定義します。ドイツ語ではフォーマルな「Sie」、イタリア語ではカジュアルな「tu」、フランス語では丁寧な「vous」。
Glossary - ソース用語をロケールごとの正確な訳語にマッピングします。たとえば「911」はヨーロッパ市場では「112」になります。製品名は翻訳しません。
Instructions - 汎用モデルが見落としがちな言語ルールを組み込みます。スペイン語での形容詞の位置、パーセント記号の前のスペース、市場ごとの代名詞の丁寧さなどです。
品質スコアリング - GEMBAスコア、BERTScore、用語集準拠、ロケール固有のバリデーター。継続的かつ自動で実行されます。