功能简介

🎙️ 该API支持将音频文件转换为文本,适用于多语言场景。

  • 支持语言:中文、英文、日语、韩语等(具体请参见语言支持列表
  • 支持格式:WAV、MP3、FLAC(文件格式示例:
    语音_文件格式
  • 模型版本:v2.3(最新模型性能提升30%)

使用参数

参数名称 说明
file 上传的音频文件(需为MP3格式)
language 指定识别语言(如:zh-CN, en-US)
model_version 选择模型版本(默认v2.3)
output_format 文本输出格式(支持JSON/TEXT)

示例请求

curl -X POST https://api.example.com/speech_to_text \
     -F "file=@example.mp3" \
     -F "language=zh-CN" \
     -F "model_version=v2.3"

适用场景

  • 会议记录生成 📝
  • 客服问答系统 💬
  • 语音笔记转写 📖
语音识别_技术

如需了解更多使用技巧,请参考语音识别进阶指南