跳转到主要内容
非实时

DashScope 同步调用

同步语音识别

POST
/api/v1/services/aigc/multimodal-generation/generation
cURL
curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
  "model": "qwen3-asr-flash",
  "input": {
    "messages": [
      {
        "content": [
          {
            "text": ""
          }
        ],
        "role": "system"
      },
      {
        "content": [
          {
            "audio": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
          }
        ],
        "role": "user"
      }
    ]
  },
  "parameters": {
    "asr_options": {
      "enable_itn": false
    }
  }
}'
{
  "request_id": "568e2bf0-d6f2-97f8-9f15-a57b11dc6977",
  "output": {
    "choices": [
      {
        "finish_reason": "stop",
        "message": {
          "annotations": [
            {
              "language": "zh",
              "type": "audio_info",
              "emotion": "neutral"
            }
          ],
          "content": [
            {
              "text": "欢迎使用千问云。"
            }
          ],
          "role": "assistant"
        }
      }
    ]
  },
  "usage": {
    "input_tokens_details": {
      "text_tokens": 0
    },
    "output_tokens_details": {
      "text_tokens": 6
    },
    "seconds": 1
  }
}

支持的音频格式

音频可通过 Base64 编码文件、本地文件路径或可公开访问的 URL 传入。HTTP 调用时,需将 messages 字段嵌套在 input 对象中。

鉴权

string
header
必填

千问云 API Key。详见获取 API Key

请求体

application/json
string
必填

模型名称。仅支持 Qwen3-ASR-Flash。

object
必填

输入对象。

object

附加参数。

响应

200-application/json
string

本次调用的唯一标识符。Java SDK 中返回为 requestId

568e2bf0-d6f2-97f8-9f15-a57b11dc6977
object

调用结果。

object

Token 消耗信息。