POST /v1/audio/transcriptions 采用 multipart/form-data,支持常见音频格式(mp3、wav 等)。
请求示例(cURL)
最佳实践
- 支持的额外字段包括
temperature、prompt、language等,可提升特定领域的识别准确率。 - 对于大文件,推荐在上传前进行压缩或切片,并开启 Rivus AI 的分片存储能力。
- 若需要实时逐字稿,可结合 Responses 接口或 MiniMaxi 提供的流式语音能力。
上传音频文件并使用 Whisper 系列模型获取转写结果。
POST /v1/audio/transcriptions 采用 multipart/form-data,支持常见音频格式(mp3、wav 等)。
temperature、prompt、language 等,可提升特定领域的识别准确率。