|
Dokumentace
Rezervovat demoPlatforma
Platforma
MCPCLIAPIWorkflows
NávodyChangelog

Začínáme

  • Úvod
  • Propojte svůj engine

Lokalizační engine

  • Přehled
  • Hlas značky
  • Instrukce
  • Glosáře
  • LLM modely
  • Cache tokeny
  • Rozhodování jazyků

Kvalita

  • Přehledy
  • AI hodnotitelé
  • Playground
  • Návrhy pro engine

Administrace

  • API klíče
  • Tým
  • Role a oprávnění
  • Auditní logy

AI hodnotitelé

AI hodnocení jsou automatizované kontroly kvality, které vyhodnocují překlady vytvořené vaším lokalizačním enginem. Po každém požadavku na překlad Lingo.dev spustí nezávislé vyhodnocení pomocí LLM, které ověří výstup – zkontroluje soulad se slovníkem, dodržování instrukcí i všechna vlastní kritéria, která definujete. Hodnocení běží asynchronně a nikdy neblokují odpověď s překladem.

Jak to funguje#

Když lokalizační engine dokončí požadavek na překlad, zařadí příslušná hodnocení do fronty k asynchronnímu vyhodnocení. Každé hodnocení používá nezávislý LLM, který dostane zdrojový text, přeložený výstup, kontext a hodnoticí kritéria. Vrátí strukturovaný výsledek – splnil/nesplnil nebo procentuální skóre – včetně zdůvodnění u ne zcela vyhovujících výsledků.

Karta Reviews v engine určuje, která hodnocení se pro daný engine spouštějí. Jsou tu tři kategorie:

KategorieCo kontrolujeTyp výsledkuKonfigurace
AI hodnocení položek slovníkuZda překlady dodržují pravidla glossary daného engineSplnil / NesplnilVestavěný přepínač pro každý engine
AI hodnocení instrukcíZda překlady dodržují všechny instructions daného engineSplnil / Nesplnil pro každou instrukciVestavěný přepínač pro každý engine
Vlastní AI hodnotiteléVaše vlastní hodnoticí kritéria definovaná na úrovni organizaceSplnil / Nesplnil nebo 0–100 %Výběr pro každý engine z hodnotitelů na úrovni organizace

Vestavěná AI hodnocení#

Každý lokalizační engine obsahuje dva vestavěné typy kontroly, které ověřují překlady podle vlastní konfigurace engine. Můžete je zapnout nebo vypnout na kartě Reviews daného engine.

AI hodnocení položek slovníku#

Kontroluje, zda překlad dodržel všechna relevantní pravidla slovníku. Pokud má engine vlastní překlady (např. "Deploy" → "Bereitstellen") nebo nepřekládané termíny (např. "OAuth"), hodnocení ověří, že je překlad respektoval.

Kontrola zohledňuje gramatické varianty – pravidlo slovníku pro termín v jednom gramatickém pádě platí pro všechny tvary daného termínu. Pokud existují konfliktní pravidla slovníku, překlad se stále považuje za vyhovující, pokud bylo dodrženo alespoň jedno z nich.

Výsledkem je jeden celkový verdikt splnil/nesplnil pro celý požadavek na překlad, včetně zdůvodnění, pokud je výsledkem nesplnil.

AI hodnocení instrukcí#

Vyhodnocuje každou instrukci samostatně. Pokud má engine tři instrukce, kontrola vrátí tři samostatné verdikty splnil/nesplnil – každý s vlastním zdůvodněním, pokud je výsledkem nesplnil.

Instrukce může vrátit N/A, pokud se její kritéria na překládaný obsah nevztahují. Například instrukce pro formální oslovení vrátí N/A, pokud překlad obsahuje jen název produktu nebo technický termín, kde formálnost není relevantní. Výsledky N/A se do souhrnných skóre nezapočítávají.

Obě vestavěná hodnocení se spustí jen tehdy, když má engine relevantní konfiguraci – pokud se žádné položky slovníku neshodují s dvojicí jazyků, AI hodnocení položek slovníku se nespustí.

Konfigurace hodnocení pro jednotlivé enginy#

Na kartě Reviews v engine určíte, která hodnocení se mají pro daný engine spouštět. Karta má dvě části:

Vestavěné přepínače nahoře ovládají AI hodnocení položek slovníku a AI hodnocení instrukcí. Jsou na sobě nezávislé – podle konfigurace engine můžete zapnout jedno i bez druhého.

Vlastní AI hodnotitelé pod přepínači zobrazují všechny AI hodnotitele definované na úrovni organizace. Každého z nich můžete pro konkrétní engine zapnout nebo vypnout. Díky tomu můžete udržovat sdílenou knihovnu kontrol kvality a nasazovat je selektivně.

Jeden engine může současně používat vestavěná hodnocení i více vlastních AI hodnotitelů. Všechna hodnocení běží asynchronně po každém požadavku na překlad a výsledky se zobrazují v translation logu a v Reports.

Typy AI hodnotitelů#

Booleovské AI hodnotitele#

Vrací binární verdikt: splnil nebo nesplnil. Hodí se pro pravidla, která buď platí, nebo ne.

Příklady:

  • "Zachovává překlad všechny HTML tagy a atributy?"
  • "Jsou pravidla pluralizace správně použita pro cílový jazyk?"
  • "Používá překlad v němčině formální oslovení (Sie)?"

Výsledky se agregují jako míra splnění – 75 % znamená, že 3 ze 4 vyhodnocených překladů kontrolou prošly.

Procentuální AI hodnotitelé#

Vrací skóre od 0 do 100. Hodí se pro dimenze kvality, které leží na škále.

Příklady:

  • "Ohodnoťte přirozenost překladu pro rodilého mluvčího (0–100)"
  • "Ohodnoťte, jak dobře překlad zachovává původní tón a záměr (0–100)"
  • "Vyhodnoťte gramatickou správnost na škále 0–100"

Výsledky se agregují jako průměry za celé období hodnocení.

Konfigurace AI hodnotitele#

PolePopis
NázevŠtítek identifikující AI hodnotitele (např. "Kontrola pluralizace")
InstrukceHodnoticí kritéria napsaná přirozeným jazykem
Typboolean (splnil/nesplnil) nebo percentage (0–100)
Zdrojový jazykZdrojový jazyk, který se má shodovat, nebo * pro libovolný
Cílový jazykCílový jazyk, který se má shodovat, nebo * pro libovolný
Poskytovatel / modelLLM používaný pro hodnocení (nezávisle na překladovém modelu)
VzorkováníProcento požadavků k vyhodnocení (0–100 %)
Povolit N/AZda může AI hodnotitel vrátit „not applicable“ pro nerelevantní dvojice
aktivníZapne nebo vypne kontrolu bez smazání konfigurace

Jak psát instrukce pro AI hodnotitele#

Pole instrukce je jádrem AI hodnotitele. Říká hodnoticímu LLM přesně, co má kontrolovat. Pište ji jako konkrétní, ověřitelné kritérium.

Dobré instrukce#

Booleovské:

text
Check whether all HTML tags in the source text are preserved
exactly in the translation. Tags must not be added, removed,
modified, or reordered. Pass if all tags are preserved, fail
if any tag is missing or altered.

Procentuální:

text
Rate the fluency of the translation on a scale of 0-100.
100 means a native speaker would find it completely natural.
0 means it reads like machine output. Deduct points for
awkward phrasing, unnatural word order, or overly literal
constructions.

Co dělá instrukci dobrou#

  • Konkrétní kritéria – přesně definujte, co znamená splnil/nesplnil nebo co představují hodnoty 0 a 100
  • Pozorovatelné výsledky – LLM musí být schopen hodnotit na základě textu, ne odhadovat záměr
  • Jedna oblast na AI hodnotitele – rozdělte vícerozměrné kontroly kvality do samostatných AI hodnotitelů

Párování jazyků#

AI hodnotitelé párují požadavky na překlad podle zdrojového a cílového jazyka. Zástupný znak * odpovídá libovolnému jazyku.

Zdrojový jazykCílový jazykOdpovídá
endePouze překladům z angličtiny do němčiny
en*Jakémukoli překladu z angličtiny
*jaJakémukoli překladu do japonštiny
**Všem překladům

Jeden požadavek na překlad může spustit více AI hodnotitelů, pokud se jich s danou dvojicí jazyků shoduje více.

Vzorkování#

Ne každý překlad musí projít kontrolou. Míra vzorkování určuje, jaké procento odpovídajících požadavků bude vyhodnoceno.

VzorkováníChování
100 %Zkontroluje se každý odpovídající požadavek (důkladné, ale nákladnější)
50 %Zkontroluje se přibližně polovina odpovídajících požadavků
10 %Jeden z deseti – užitečné pro enginy s vysokým objemem, kde jsou trendy důležitější než jednotlivá skóre
0 %AI hodnotitel je fakticky pozastavený, aniž byste ho museli vypnout

Vzorkování se uplatňuje při zpracování požadavku pomocí náhodné kontroly. Při dostatečném objemu požadavků se skutečná míra vyhodnocení přiblíží nakonfigurovanému procentu.

Podpora N/A#

Když je allowsNA aktivní, může hodnoticí LLM vrátit „not applicable“ místo skóre. To je užitečné pro AI hodnotitele, jejichž kritéria se nevztahují na každou dvojici jazyků.

Příklad: AI hodnotitel kontrolující pravidla formálního oslovení vrátí N/A pro překlady z angličtiny do angličtiny (angličtina nerozlišuje formální a neformální oslovení), ale vrátí skóre pro překlady z angličtiny do němčiny.

Výsledky N/A se v reportech nezapočítávají do průměrů ani míry splnění – nesnižují skóre ani je uměle nenavyšují.

Zdůvodnění#

AI hodnotitelé poskytují u ne zcela vyhovujících výsledků zdůvodnění, abyste snáz pochopili, co se pokazilo:

  • Perfektní skóre (splnil nebo 100 %) – zdůvodnění je null (není co vysvětlovat)
  • N/A – zdůvodnění je null
  • Ne zcela vyhovující skóre – stručné jednověté vysvětlení

Díky tomu jsou výsledky kontroly prakticky použitelné: když překlad kontrolou neprojde, zdůvodnění vám bez nutnosti ručního pátrání řekne proč.

Model pro kontrolu#

Každý AI hodnotitel má vlastní konfiguraci poskytovatele LLM a modelu, nezávislou na překladovém modelu. Toto oddělení je záměrné – model, který překlad vytváří, by neměl být stejný jako model, který ho vyhodnocuje.

Nezávislost modelu

Použití jiného modelu pro kontrolu než pro překlad přináší nezávislé posouzení. Pokud překlad vytváří GPT-4o, vyhodnocení pomocí Claude Sonnet vám dá druhý názor místo sebehodnocení.

Reporty AI hodnotitelů#

Výsledky kontroly se v dashboardu zobrazují v sekci reportů AI hodnotitelů a ukazují:

  • Míra splnění v čase – u booleovských AI hodnotitelů vykreslená jako denní procenta
  • Průměrné skóre v čase – u procentuálních AI hodnotitelů vykreslené jako denní průměry
  • Rozpis podle dvojic jazyků – uvidíte, jak si jednotlivé dvojice zdroj → cíl vedou samostatně
  • Souhrnné zobrazení – spojí všechny dvojice jazyků do jedné trendové čáry

Reporty AI hodnotitelů doplňují Reports zaměřené na objem – dohromady vám dávají úplný přehled o propustnosti i kvalitě.

Správa AI hodnotitelů přes MCP#

Pokud používáte Lingo.dev MCP server, váš AI asistent pro psaní kódu může AI hodnotitele vytvářet a konfigurovat přímo:

text
"Create a boolean AI reviewer for all locale pairs that checks
whether HTML tags are preserved in translations."
text
"Add a percentage AI reviewer for English to German that rates
translation fluency on a 0-100 scale, sampling 50% of requests."

Další kroky#

Reports
Sledujte objem překladů, spotřebu tokenů a pokrytí jazyků
LLM modely
Nakonfigurujte překladové modely, které AI hodnotitelé vyhodnocují
Slovníky
Nastavte termíny, vůči kterým mohou AI hodnotitelé kontrolovat soulad se slovníkem
API Reference
Integrujte lokalizační API do svého workflow

Byla tato stránka užitečná?

Max PrilutskiyMax Prilutskiy·Aktualizováno přibližně před 1 měsícem·7 min čtení