POST
/api/v1/services/aigc/multimodal-generation/generation
cURL
复制
curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-asr-flash",
"input": {
"messages": [
{
"content": [
{
"text": ""
}
],
"role": "system"
},
{
"content": [
{
"audio": "https://dashscope.oss-cn-beijing.aliyuncs.com/audios/welcome.mp3"
}
],
"role": "user"
}
]
},
"parameters": {
"asr_options": {
"enable_itn": false
}
}
}'复制
{
"request_id": "568e2bf0-d6f2-97f8-9f15-a57b11dc6977",
"output": {
"choices": [
{
"finish_reason": "stop",
"message": {
"annotations": [
{
"language": "zh",
"type": "audio_info",
"emotion": "neutral"
}
],
"content": [
{
"text": "欢迎使用千问云。"
}
],
"role": "assistant"
}
}
]
},
"usage": {
"input_tokens_details": {
"text_tokens": 0
},
"output_tokens_details": {
"text_tokens": 6
},
"seconds": 1
}
}支持的音频格式
音频可通过 Base64 编码文件、本地文件路径或可公开访问的 URL 传入。HTTP 调用时,需将 messages 字段嵌套在 input 对象中。鉴权
string
header
必填
千问云 API Key。详见获取 API Key。
请求体
application/jsonstring
必填
模型名称。仅支持 Qwen3-ASR-Flash。
object
必填
响应
200-application/json
string
本次调用的唯一标识符。Java SDK 中返回为 requestId。
示例:568e2bf0-d6f2-97f8-9f15-a57b11dc6977
object
调用结果。
显示子属性
显示子属性
object[]
模型输出,当 result_format 为 message 时返回。
示例:
复制
[
{
"finish_reason": "stop",
"message": {
"annotations": [
{
"language": "zh",
"type": "audio_info",
"emotion": "neutral"
}
],
"content": [
{
"text": "欢迎使用千问云。"
}
],
"role": "assistant"
}
}
]显示子属性
显示子属性
enum<string>
生成中为 null,自然结束时为 stop,超出最大长度时为 length。
可选值:stop,length,null
示例:stop
object
模型输出的消息对象。
显示子属性
显示子属性
string
输出消息的角色,始终为 assistant。
示例:assistant
object[]
输出的注释信息。
示例:
复制
[
{
"language": "zh",
"type": "audio_info",
"emotion": "neutral"
}
]
