Skip to main content

다중 채널 지원

다중 채널 지원은 일반 STT API에서 2개 이상 채널이 포함된 오디오 파일을 텍스트로 변환하는 기능입니다. 본 문서는 다중 채널 지원을 이용하기 위한 설정 가이드를 제공합니다.

다중 채널 지원을 사용하면, 2개 이상의 채널로 구성된 오디오 파일로부터 채널별로 화자를 구분할 수 있습니다. 예를 들어 두 명의 화자가 대화할 때, 음성이 각자의 채널로 녹음되어 총 2개의 채널이 오디오 파일에 포함된 경우에 이 기능을 사용할 수 있습니다.

다중 채널 지원 기능을 사용하기 위해서는, API 요청 시에 use_multi_channel 옵션을 true로 설정해야 합니다.

여러 채널이 포함된 요청을 보낼 경우, 결과는 일반 전사 결과와 동일하며 spk 필드에 각 채널의 ID 값을 순차적으로 지정하여 내려줍니다.

caution

다중 채널 지원을 사용할 경우, 채널별 변환 결과의 총사용량이 사용 한도로 계산됩니다. 자세한 내용은 사용 한도 문서에서 확인하실 수 있습니다.

샘플 코드

아래의 코드 샘플에서 다중 채널 지원을 사용하는 방법을 확인하실 수 있습니다.


curl -X 'POST' \
'https://openapi.vito.ai/v1/transcribe' \
-H 'accept: application/json' \
-H 'Authorization: Bearer YOUR_JWT_TOKEN' \
-H 'Content-Type: multipart/form-data' \
-F 'file=@sample.wav' \
-F 'config={
"use_multi_channel": true
}'