Skip to main content

간투어 필터

간투어 필터는 발화에서 큰 의미가 없는 표현을 제거하여 보다 간결한 텍스트를 제공하는 기능입니다. 본 문서는 간투어 필터를 이용하기 위한 설정 가이드를 제공합니다.

간투어에 해당하는 예시는 다음과 같습니다. 간투어를 제거 했을 때, 문장의 가독성이 더욱 좋아지는 것을 확인하실 수 있습니다.

  • , , 와 같이 발성자가 다음 발성을 준비하기 위해서 소요되는 시간을 벌기 위해서 발성하는 표현

    예) 아 아직 일층이요 뭐 그래 지금 갈게 뭐 가져왔어 -> 아직 일층이요 그래 지금 갈게 뭐 가져왔어

  • 중복 발화 표현
    예) 응응응 우 우 우리 번호 우리 번호가 일 일 사 사 번인가 -> 응 우리 번호가 일 일 사 사 번인가

간투어 필터 기능을 사용하기 위해서는, API 요청 시에 use_disfluency_filter 옵션을 true로 설정해야 합니다.
(기본값: On (true))

샘플 코드

아래의 코드 샘플에서 간투어 필터를 사용하는 방법을 확인하실 수 있습니다.


curl -X 'POST' \
'https://openapi.vito.ai/v1/transcribe' \
-H 'accept: application/json' \
-H 'Authorization: Bearer YOUR_JWT_TOKEN' \
-H 'Content-Type: multipart/form-data' \
-F 'file=@sample.wav' \
-F 'config={
"use_disfluency_filter": true
}'