图片和视频生成的常见问题——计费、API 报错、模型差异、输入要求和输出 URL。
调试
如何在本地调试图片 API?
图片 API 支持标准 HTTP 调用,本地测试步骤如下:
- 开通模型服务并获取 API Key,然后将 API Key 设为环境变量。
- 在图片 API 文档中找到
curl命令,在终端(macOS/Linux)中运行,或使用 Postman、Apifox 等 API 平台(Windows)。
使用 API 平台时,请将
Authorization 请求头中的 $DASHSCOPE_API_KEY 替换为您的实际 API Key,例如 Bearer sk-xxxxxx。计费与限流
图片模型如何计费?
每个图片模型都有免费额度,且可能按图计价。免费额度和限流在千问云账号下共享。仅成功生成的输出图片计费——输入图片和失败请求不消耗额度,也不产生费用。
详见计费概述。
"限时免费"是什么意思?
模型处于公测阶段。免费额度用完后,模型将不可用。
如何获取免费额度?
开通千问云时自动获得免费额度,有效期 90 天,在千问云账号下共享。详见新用户免费额度。
何时开始收费?
如果模型标明了单价,免费额度用完或过期后开始收费,费用从千问云账户扣除。
视频模型如何计费?
视频生成按成功生成的视频时长计费,失败的任务不收费。免费额度在图片和视频生成模型之间共享。
API 报错
常见的图片 API 报错:
| 错误码 | 错误信息 | 常见原因 |
|---|---|---|
BadRequest.InputDownloadFailed | Reference image download failed | 图片 URL 错误、不可访问或有访问限制 |
InvalidParameter | Required body invalid | 请求体中包含客户端无法解析的中文字符 |
| (下载超时) | Download the media resource timed out | 中国大陆以外地区与服务端点之间的网络不稳定 |
BadRequest.InputDownloadFailed:"Reference image download failed"
InvalidParameter:"Required body invalid"
curl 请求体中包含客户端无法正确解析的中文字符。
解决方法: 在终端(macOS/Linux 原生支持 UTF-8)中运行 curl 命令,或使用 Postman、Apifox 等 HTTP 平台。
中国大陆以外地区的资源下载超时
Wan2.6 图片生成与编辑
API: 同步调用、创建任务、查询结果
Wan2.6 支持哪些图片编辑模式?
Wan2.6 通过 enable_interleave 参数控制两种模式:
- 图片编辑(
enable_interleave=false,默认):编辑图片、风格迁移或生成主体一致的图片。输入:1–4 张图片。输出:1–4 张图片。 - 图文交错输出(
enable_interleave=true):生成图文混合内容。输入:0–1 张图片。必须使用流式输出。
图片输入有什么要求?
- 格式: JPEG、JPG、PNG(不支持 Alpha 通道)、BMP、WEBP。
- 分辨率: 宽和高各在 240 到 8,000 像素之间。
- 文件大小: 单张不超过 10 MB。
- 图片数量: 编辑模式:1–4 张。交错模式:0–1 张。
如何通过 Base64 编码传入图片?
可以用 Base64 编码字符串替代公开 URL,格式为 data:{mime_type};base64,{base64_data}(例如 data:image/jpeg;base64,/9j/4AAQ...)。
如何使用图文交错输出模式?
图文交错输出(enable_interleave=true)必须使用流式输出,需同时设置:
X-DashScope-Sse请求头为enableparameters.stream为true
max_images(1–5,默认 5)控制生成图片的最大数量。该模式下 n 必须为 1。
支持哪些输出分辨率?
图片编辑模式: 使用 1K(默认,约 1280*1280)或 2K(约 2048*2048)自动匹配输入比例,或在 [768*768, 2048*2048] 范围内指定具体的 width*height。
交错模式: 尺寸在 [768*768, 1280*1280] 范围内。推荐值:1280*1280、800*1200、1200*800、960*1280、1280*960、720*1280、1280*720、1344*576。
生成的图片 URL 有效期多久?
生成的图片 URL 有效期为 24 小时,请在生成后及时下载。
Qwen 文生图
API: Qwen text-to-image
是否应该启用 prompt_extend 参数?
对简单提示词建议启用(默认开启),可提升生成质量。如果需要精确控制、已有详细描述或对延迟敏感,建议关闭(设为 false)。详见图片提示词指南。
Qwen-Image 各模型有什么区别?
统一图片生成与编辑模型(推荐):
qwen-image-2.0-pro:专业文字渲染,细粒度真实感,语义一致性更强。仅支持同步调用。qwen-image-2.0:高质量生成,速度快于 qwen-image-2.0-pro。仅支持同步调用。
qwen-image-max:相比 qwen-image-plus,真实感更强、纹理和细节更丰富。qwen-image-plus/qwen-image:能力相同。qwen-image-plus为当前推荐选项;qwen-image保留以兼容旧版。
Qwen 图片编辑
API: Qwen image editing
Qwen 图片编辑模型支持哪些语言?
模型官方支持简体中文和英文,其他语言可能可用但不保证效果。
Qwen 图片编辑的图片输入要求是什么?
- 格式: JPG、JPEG、PNG、BMP、TIFF、WEBP、GIF(仅取第一帧)。输出固定为 PNG。
- 分辨率: 宽和高在 384 到 3072 像素之间。超出范围可能导致输出模糊或增加处理时间。
- 文件大小: 单张不超过 10 MB。
- 图片数量: 每次请求 1 到 3 张。
如何通过 Base64 编码传入图片?
可以用 Base64 编码字符串替代 URL,格式为 data:{mime_type};base64,{base64_data}(例如 data:image/jpeg;base64,/9j/4AAQ...)。完整示例请参见 API 参考中的代码示例。
Z-Image
如何查看模型调用指标?
模型调用指标(调用次数、成功率)在生成任务完成一小时后可在用量分析页面查看。另见:账单查询与费用管理。
视频生成
API: 文生视频、图生视频、图生视频(首尾帧)、视频编辑
图生视频的图片输入要求是什么?
- 格式: JPEG、JPG、PNG、WEBP 等常见格式。
- 大小: 单张不超过 10 MB。
- URL: 必须是可公开访问的 HTTP(S) URL。服务在生成时会下载图片。
wan2.6 和 wan2.5 的要求有所不同——请参阅所用模型的 API 参考。
视频生成需要多长时间?
视频生成是异步的。提交任务后,每 10–30 秒轮询查询端点,直到状态从 PENDING 或 RUNNING 变为 SUCCEEDED 或 FAILED。生成时间取决于视频时长、分辨率和队列负载,通常需要一到数分钟。

