Skip to main content

다중 채널 지원

다중 채널 지원은 일반 STT API에서 2개 이상 채널이 포함된 오디오 파일을 텍스트로 변환하는 기능입니다. 본 문서는 다중 채널 지원을 이용하기 위한 설정 가이드를 제공합니다.

다중 채널 지원을 사용하면, 2개 이상의 채널로 구성된 오디오 파일로부터 채널별로 화자를 구분할 수 있습니다. 예를 들어 두 명의 화자가 대화할 때, 음성이 각자의 채널로 녹음되어 총 2개의 채널이 오디오 파일에 포함된 경우에 이 기능을 사용할 수 있습니다.

다중 채널 지원 기능을 사용하기 위해서는, API 요청 시에 use_multi_channel 옵션을 true 로 설정해야 합니다.
(파라미터 기본값은 false입니다.)

여러 채널이 포함된 요청을 보낼 경우, 결과는 일반 전사 결과와 동일하며 spk 필드에 각 채널의 ID 값을 순차적으로 지정하여 내려줍니다.

caution

다중 채널 지원을 사용할 경우, 채널별 발화 구간 길이의 합이 사용량으로 계산됩니다. 자세한 내용은 사용 한도 문서에서 확인하실 수 있습니다.

사용법

아래의 코드 샘플에서 다중 채널 지원을 사용하는 방법을 확인하실 수 있습니다.


curl -X "POST" \
"https://openapi.vito.ai/v1/transcribe" \
-H "accept: application/json" \
-H "Authorization: Bearer ${YOUR_JWT_TOKEN}" \
-H "Content-Type: multipart/form-data" \
-F "file=@sample.wav" \
-F 'config={
"use_multi_channel": true
}'