Audio · Transcriptions - Rivus AI 用户文档

POST /v1/audio/transcriptions 采用 multipart/form-data，支持常见音频格式（mp3、wav 等）。

请求示例（cURL）

curl -X POST "$BASE_URL/v1/audio/transcriptions" \
  -H "Authorization: Bearer $TOKEN" \
  -F "model=whisper-1" \
  -F "file=@sample.wav"

最佳实践

支持的额外字段包括 temperature、prompt、language 等，可提升特定领域的识别准确率。
对于大文件，推荐在上传前进行压缩或切片，并开启 Rivus AI 的分片存储能力。
若需要实时逐字稿，可结合 Responses 接口或 MiniMaxi 提供的流式语音能力。

Audio · Speech Audio · Translations