Skip to main content
POST /v1/audio/transcriptions 采用 multipart/form-data,支持常见音频格式(mp3、wav 等)。

请求示例(cURL)

curl -X POST "$BASE_URL/v1/audio/transcriptions" \
  -H "Authorization: Bearer $TOKEN" \
  -F "model=whisper-1" \
  -F "file=@sample.wav"

最佳实践

  • 支持的额外字段包括 temperaturepromptlanguage 等,可提升特定领域的识别准确率。
  • 对于大文件,推荐在上传前进行压缩或切片,并开启 Rivus AI 的分片存储能力。
  • 若需要实时逐字稿,可结合 Responses 接口或 MiniMaxi 提供的流式语音能力。