Skip to main content

간투어 필터

간투어 필터는 발화에서 큰 의미가 없는 표현을 제거하여 보다 간결한 텍스트를 제공하는 기능입니다. 본 문서는 간투어 필터를 이용하기 위한 설정 가이드를 제공합니다.

간투어에 해당하는 예시는 다음과 같습니다. 간투어를 제거 했을 때, 문장의 가독성이 더욱 좋아지는 것을 확인하실 수 있습니다.

  • , , 와 같이 발화 중간에 큰 의미 없이 머뭇거리는 표현 예) 아 아직 일층이요 뭐 그래 지금 갈게 뭐 가져왔어 -> 아직 일층이요 그래 지금 갈게 뭐 가져왔어
  • 중복 발화 표현 예) 응응응 우 우 우리 번호 우리 번호가 일 일 사 사 번인가 -> 응 우리 번호가 일 일 사 사 번인가

간투어 필터 기능을 사용하기 위해서는, API 요청 시에 use_disfluency_filter 파라미터를 true 로 설정해야 합니다.
(파라미터 기본값은 true 입니다.)

사용법

아래의 코드 샘플에서 간투어 필터를 사용하는 방법을 확인하실 수 있습니다.


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"use_disfluency_filter": true
}'