语音识别服务

上传音频文件进行语音识别,支持多种语言和上下文信息

API 代理地址
使用此URL调用语音识别API,解决跨域问题

• 方法: POST

• Content-Type: application/json

• 支持所有现代编程语言调用

输入设置
配置语音识别参数并上传音频文件
识别结果
语音识别的输出结果

等待识别结果...

请上传音频文件并点击"开始识别"

API 使用说明
如何使用语音识别API

端点: POST /api/asr-inference

参数:

  • audio_file (必需): 音频文件数据
  • context (可选): 上下文信息,默认为空字符串
  • language (可选): 语言设置,默认为"auto"
  • enable_itn (可选): 是否启用逆文本标准化,默认为false

返回:

  • data[0]: 识别结果文本
  • data[1]: 语种检测结果(仅在auto模式下返回)

请求示例:

{
  "audio_file": {
    "data": "base64编码的音频数据",
    "name": "audio.wav",
    "type": "audio/wav",
    "size": 12345
  },
  "context": "上下文信息",
  "language": "auto",
  "enable_itn": false
}

响应示例:

{
  "success": true,
  "data": [
    "这是识别出的文本内容",
    "检测到的语言:中文"
  ]
}