功能简介
🎙️ 该API支持将音频文件转换为文本,适用于多语言场景。
- 支持语言:中文、英文、日语、韩语等(具体请参见语言支持列表)
- 支持格式:WAV、MP3、FLAC(文件格式示例:
) - 模型版本:v2.3(最新模型性能提升30%)
使用参数
参数名称 | 说明 |
---|---|
file |
上传的音频文件(需为MP3格式) |
language |
指定识别语言(如:zh-CN, en-US) |
model_version |
选择模型版本(默认v2.3) |
output_format |
文本输出格式(支持JSON/TEXT) |
示例请求
curl -X POST https://api.example.com/speech_to_text \
-F "file=@example.mp3" \
-F "language=zh-CN" \
-F "model_version=v2.3"
适用场景
- 会议记录生成 📝
- 客服问答系统 💬
- 语音笔记转写 📖
如需了解更多使用技巧,请参考语音识别进阶指南。