보고서를 통해 로컬라이제이션 엔진의 성과를 한눈에 파악할 수 있습니다. 번역량, 토큰 사용량, 로캘 커버리지, 용어집 깊이, 코드베이스 변경률, AI 평가자 품질 지표까지 폭넓게 확인할 수 있습니다. 모든 보고서는 조직 범위로 제공되며, 요청이 엔진을 거칠 때마다 자동으로 업데이트됩니다.
사용 가능한 보고서#
| 보고서 | 측정 내용 |
|---|---|
| 단어 생성량 | 일별 번역 단어 수 |
| 토큰 사용량 | 일별 입력 및 출력 토큰 사용량 |
| 상위 로캘 | 가장 많은 리소스를 사용하는 로캘 |
| 용어집 깊이 | 로캘별 용어집 항목 수 |
| 변경률 | 로캘별 GitHub의 로컬라이제이션 파일 변경 |
| 평균 점수 | AI 평가자의 일일 평균 번역 점수 |
| 용어 적용률 | 번역에 용어집 용어가 얼마나 일관되게 적용되는지 |
| 지침 준수도 | 번역에서 사용자 지정 지침이 얼마나 일관되게 지켜지는지 |
단어 생성량#
로컬라이제이션 엔진이 처리한 전체 단어 수를 일별로 집계해 추적합니다. 번역량 추이를 파악하고 용량 계획을 세우는 데 유용합니다.
필터: 엔진, 기간(월), 소스 로캘, 타깃 로캘
차트에는 선택한 월의 각 날짜별로 막대가 하나씩 표시됩니다. 번역 활동이 없는 날은 0으로 표시됩니다.
토큰 사용량#
LLM 토큰 사용량을 입력 토큰과 출력 토큰으로 나눠 일별로 집계해 보여줍니다. 토큰 사용량은 비용과 직접 연결되므로, 이 보고서를 통해 비용 급증 구간을 파악하고 엔진 또는 로캘 쌍별 효율을 비교할 수 있습니다.
필터: 엔진, 기간(월), 소스 로캘, 타깃 로캘
입력 토큰 vs. 출력 토큰
입력 토큰에는 system prompt, 용어집, 브랜드 보이스, 지침, 원문 텍스트가 포함됩니다. 출력 토큰은 번역 결과입니다. 입력 대비 출력 비율이 높다면 엔진 컨텍스트(용어집, 지침)가 번역된 콘텐츠에 비해 큰 편이라는 뜻일 수 있습니다.
상위 로캘#
리소스 사용량을 기준으로 로캘 순위를 매겨, 어떤 언어가 가장 많은 번역량과 비용을 만들어내는지 파악할 수 있도록 도와줍니다. 소스 로캘 또는 타깃 로캘 기준으로 순위를 볼 수 있으며, 입력 토큰, 출력 토큰 또는 단어 수를 기준으로 측정할 수 있습니다.
필터: 엔진, 기간(월), 로캘 유형(소스 또는 타깃), 지표(입력 토큰, 출력 토큰 또는 단어 수)
이 보고서는 "어떤 타깃 로캘이 가장 많은 토큰을 사용하나요?" 또는 "어떤 소스 언어가 가장 많은 단어를 생성하나요?" 같은 질문에 답해 줍니다.
용어집 깊이#
엔진 전반에서 로캘별 용어집 항목 수를 보여줍니다. 다른 보고서와 달리 시계열 데이터가 아니라 현재 시점의 스냅샷으로, 현재 용어집 구성 상태를 반영합니다.
필터: 엔진, 로캘 유형(소스 또는 타깃)
이 보고서를 통해 빈틈을 파악할 수 있습니다. 예를 들어 엔진이 12개 로캘로 번역하지만 그중 3개에만 용어집 항목이 있다면, 나머지 로캘은 용어 선택을 전적으로 모델의 판단에 의존하게 됩니다.
변경률#
연결된 GitHub 리포지토리에서 발생하는 로컬라이제이션 파일 변경 속도를 로캘별, 일자별로 추적합니다. 이 보고서를 사용하려면 GitHub 연동이 활성화되어 있어야 하며, 아직 설정되지 않았다면 GitHub 연결 안내가 표시됩니다.
필터: 기간(월), 리포지토리, 로캘
변경률 보고서는 "각 로캘은 얼마나 활발하게 업데이트되고 있나요?" 또는 "어떤 리포지토리에서 가장 많은 로컬라이제이션 변경이 발생하나요?" 같은 질문에 답하는 데 도움이 됩니다.
시간대 지원
날짜 그룹화는 조직에 설정된 시간대를 따릅니다. UTC 기준 23:30에 생성된 커밋도 다음 날로 밀리지 않고 올바른 현지 날짜에 표시됩니다.
평균 점수#
AI 평가자의 일일 평균 번역 점수를 백분율로 시각화합니다. 이를 통해 시간에 따른 품질 추이를 추적하고, 엔진·모델·용어집 변경 이후 발생한 회귀를 빠르게 포착할 수 있습니다.
필터: 엔진, 기간(월), 보기(집계 또는 세부 보기)
단일 엔진을 볼 때는 각 선이 해당 엔진에 연결된 하나의 채점기를 나타냅니다. 모든 엔진을 함께 볼 때는 모든 엔진의 모든 채점기를 평균한 단일 선을 보려면 집계를, 채점기별 차이를 나란히 비교하려면 세부 보기를 선택하세요.
AI 평가자 필요
이 보고서는 최소 1개의 AI 평가자가 구성되어 실제로 번역을 채점하기 시작한 이후에만 데이터를 표시합니다.
용어 적용률#
번역에서 용어집 용어가 매일 얼마나 일관되게 올바르게 적용되는지 추적합니다. 선 그래프는 일일 적용률(올바르게 적용된 용어 ÷ 전체 관련 용어)을, 막대 그래프는 적용된 용어의 절대 개수를 보여줍니다. 마우스를 올리면 적용 수/전체 수의 세부 내역과 각 데이터 포인트를 뒷받침하는 검토 수를 확인할 수 있습니다.
필터: 엔진, 기간(월)
적용된 용어 수는 많은데 적용률이 떨어진다면, 번역량이 늘어날수록 용어집 용어가 누락되거나 잘못 번역되는 일이 더 자주 발생하고 있다는 신호입니다. 이는 용어집이나 엔진 지침을 점검해야 한다는 유용한 조기 경고가 될 수 있습니다.
지침 준수도#
엔진의 사용자 지정 instructions가 번역에서 매일 얼마나 일관되게 지켜지는지 추적합니다. 백분율은 지침이 실제로 관련 있었던 검토만을 기준으로 계산되며, 툴팁에는 followed / relevant가 표시되어 비율과 표본 수를 함께 확인할 수 있습니다.
필터: 엔진, 기간(월)
새로 추가한 지침이 실제로 동작을 바꾸는지 확인하고, 모델 교체나 프롬프트 변경 이후 엔진이 규칙을 무시하기 시작하는 회귀를 포착하는 데 유용합니다.
필터링 및 기간#
모든 시간 기반 보고서는 월 단위 기간으로 동작하며, 기본값은 현재 월입니다. 필터는 URL에 유지되므로 필터링된 보기를 공유하거나 북마크할 수 있습니다.
보고서 전반에서 공통으로 사용되는 필터:
| 필터 | 사용 가능한 보고서 | 설명 |
|---|---|---|
| 엔진 | 단어 생성량, 토큰 사용량, 상위 로캘, 용어집 깊이, 평균 점수, 용어 적용률, 지침 준수도 | 특정 엔진만 보거나 전체를 확인 |
| 기간 | 단어 생성량, 토큰 사용량, 상위 로캘, 변경률, 평균 점수, 용어 적용률, 지침 준수도 | 월 선택(YYYY-MM) |
| 소스 로캘 | 단어 생성량, 토큰 사용량 | 소스 언어 기준으로 필터링 |
| 타깃 로캘 | 단어 생성량, 토큰 사용량 | 타깃 언어 기준으로 필터링 |
| 리포지토리 | 변경률 | GitHub 리포지토리 기준으로 필터링 |
| 보기 | 평균 점수 | 단일 집계 선 또는 채점기별 세부 보기 |
품질 vs. 볼륨#
보고서는 서로 보완적인 두 가지 관점으로 나뉩니다. 볼륨 및 비용(단어 생성량, 토큰 사용량, 상위 로캘, 용어집 깊이, 변경률)과 품질(평균 점수, 용어 적용률, 지침 준수도)입니다. 품질 보고서를 보려면 최소 1개의 AI 평가자가 구성되어 있어야 합니다.
