Skip to main content

키워드 부스팅

keywords 파라미터는 특정 키워드에 대한 전사 정확도를 높이기 위해 사용됩니다. 이 파라미터에 리스트 형태로 단어를 지정하면, 해당 단어들이 포함된 음성 데이터에 대한 전사 결과가 개선될 수 있습니다.

현재 키워드 부스팅은 한글만 지원합니다.

NameTypeDescriptionExample
keywordsarray전사 정확도를 높일 키워드 리스트["리턴제로", "음성인식", "에스티티"]
caution
  • keywords에 입력하는 단어는 한글 발음대로 적어야 합니다. <예시: STT (X), 에스티티 (O)>
  • keywords에 입력하는 단어는 한글만 구성되어야 하며 음절이어야 합니다. <예시: 에스TT (X), 에스ㅌㅌ (X), 에스티티2 (X), 에스티티 (O)>
  • 각 단어의 길이는 20자 이하로 제한되며, 단어의 개수는 최대 100개까지 지원합니다.

사용법


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"keywords": ["리턴제로", "음성인식", "에스티티"]
}'

keywords를 넣었을 때의 응답 결과 개선 예시

전사 요청시 keywords["음성인식"]을 지정했을 때, 화자의 발음이 불분명해서 "리턴제로는 음성의식을 하는 회사입니다."라고 발음으로 전사한 경우 이를 "음성인식"으로 교정합니다.

{
"id": "G6j7wIYxSCCz3gYtQbeYdQ",
"status": "completed",
"results": {
"utterances": [
{
"start_at": 1187,
"duration": 600,
"spk": 0,
"spk_type": "NORMAL",
- "msg": "리턴제로는 음성의식을 하는 회사입니다."
+ "msg": "리턴제로는 음성인식을 하는 회사입니다."
}
]
}
}