使用万相图像背景生成模型为商品图像生成高质量背景,支持文本引导、图像引导以及边缘引导元素。
万相图像背景生成模型专为商品换背景而设计。您可以选择文本引导(通过输入中英文描述生成背景)、图像引导(使用现有图片作为背景参考),或同时结合这两种方式。此外,模型还支持使用边缘引导元素(即图像的增强边缘特征),可以指定前景和背景内容。借助边缘引导元素,前景和背景在生成时能更自然地与商品融合。该模型适合电商和海报场景,助您快速生成高质量的商品图像。
模型效果示意
模型说明
本文的示例代码使用HTTP调用。在调用前,您需要开通模型服务并获取API Key,再配置API Key到环境变量。
图像模型处理时间较长,为了避免请求超时,HTTP调用仅支持异步获取模型结果。您需要发起两个请求:
万相图像背景生成模型提供多种背景生成方式。生成方式从简单到复杂依次排列如下:
最简单的生成方式,推荐优先尝试。通过输入中英文描述,即可为主体图像生成背景。
字数限制:英文最多支持150个单词,中文大概是100到120个中文字符,超过部分会被自动忽略。
基于引导图像为主体商品生成相似背景。模型能够将主体图像自然地融合至基于引导图像生成的背景中。
设置noise_level字段
通过
您还可以结合引导文本和引导图像生成主体商品的背景。
设置ref_prompt_weight字段
当同时设置引导文本和引导图像时,可通过
结合引导文本、引导图像,以及边缘引导元素图像(前景或背景),适用于复杂且需要细节的商品背景生成场景。对于边缘引导元素图像,前景图像会对主体商品产生遮挡,而背景图像的图层则位于主体商品之后。需要注意的是,前景和背景图像需通过边缘引导算法生成。
为什么前景和背景需要使用边缘引导算法生成?
图像背景任务通常采用边缘引导算法,因其能够有效保留图像中的边缘和结构信息,同时增强细节表现,提高生成结果的自然性和真实感。
怎么添加前景/背景元素?
主体图像必须为带透明背景的RGBA四通道图像,即主体为彩色且背景为透明的图像。输出图像的分辨率与该图像保持一致。
引导图像可以是RGB图像或带透明背景的RGBA图像。对于RGBA图像,Alpha通道值为0的区域不参与引导过程的生成。
每个前景或背景图像必须为带透明背景的RGBA四通道图像,分辨率和主体图像相同,如果不同则会自动缩放到和主体图像相同的分辨率。
图像背景生成模型为
模型概览
模型效果示意

| 模型名 | 计费单价 | 任务下发接口QPS限制 | 同时处理中任务数量 | 免费额度(查看) |
|---|---|---|---|---|
| wanx-background-generation-v2 | 0.08元/张 | 2 | 1 | 500张 |
前期准备
本文的示例代码使用HTTP调用。在调用前,您需要开通模型服务并获取API Key,再配置API Key到环境变量。
图像模型处理时间较长,为了避免请求超时,HTTP调用仅支持异步获取模型结果。您需要发起两个请求:
- 创建任务:首先发送一个请求创建任务,该请求会返回任务ID。下文的示例代码已提供创建任务代码。
- 根据任务ID查询结果:使用上一步获得的任务ID,查询模型生成的结果。查询接口如下所示,需要将
86ecf553-d340-4e21-xxxxxxxxx替换为真实的任务ID。
关键能力
万相图像背景生成模型提供多种背景生成方式。生成方式从简单到复杂依次排列如下:
- 文本引导:最简单的生成方式,通过输入中英文描述即可生成背景。
- 图像引导:基于引导图像生成相似背景。
noise_level可用于调整生成背景与引导图像之间的相关性。 - 文本+图像引导:当结合引导文本和引导图像时,可通过
ref_prompt_weight设置引导文本的权重,调整引导文本和引导图像对生成背景的影响。 - 文本、图像以及引入边缘引导元素(前景/背景):适合复杂且需要细节的商品背景生成场景。比如,设置商品摆放的展台为前景,模型会将展台和主体商品自然地融合。这里的前景或背景需要使用边缘引导算法生成。文本、图像及边缘引导元素可以自由组合成多种生成方式。下文将以文本+图像+边缘引导元素(前景/背景) 为例,展示边缘引导元素对图像背景生成的影响。
使用建议:优先体验文本引导或图像引导,再使用文本与图像结合的引导方式。若商品背景要求高且场景复杂,可以考虑选择包含边缘引导元素的生成方式。
文本引导
最简单的生成方式,推荐优先尝试。通过输入中英文描述,即可为主体图像生成背景。
字数限制:英文最多支持150个单词,中文大概是100到120个中文字符,超过部分会被自动忽略。

示例代码
示例代码
图像引导
基于引导图像为主体商品生成相似背景。模型能够将主体图像自然地融合至基于引导图像生成的背景中。

示例代码
示例代码
noise_level调整生成的背景与引导图像之间的相关性。noise_level字段的取值范围为[0,999],默认值为300。
- 数值越小:表示生成背景与引导图像的相关性越高。
- 数值越大:表示生成背景与引导图像的相关性越低。

文本+图像引导
您还可以结合引导文本和引导图像生成主体商品的背景。

示例代码
示例代码
ref_prompt_weight设置引导文本的权重,调整引导文本和引导图像对生成背景的影响程度。ref_prompt_weight字段的取值范围为[0,1],默认值为0.5。
- ref_prompt_weight < 0.5:表示引导图像对生成背景的影响更大。
- ref_prompt_weight = 0.5:表示引导文本和引导图像权重各为0.5,对于生成背景的影响程度一样。
- ref_prompt_weight > 0.5:表示引导文本对生成背景的影响更大。

文本+图像+边缘引导元素(前景/背景)
结合引导文本、引导图像,以及边缘引导元素图像(前景或背景),适用于复杂且需要细节的商品背景生成场景。对于边缘引导元素图像,前景图像会对主体商品产生遮挡,而背景图像的图层则位于主体商品之后。需要注意的是,前景和背景图像需通过边缘引导算法生成。
为什么前景和背景需要使用边缘引导算法生成?
图像背景任务通常采用边缘引导算法,因其能够有效保留图像中的边缘和结构信息,同时增强细节表现,提高生成结果的自然性和真实感。
怎么添加前景/背景元素?
- 使用边缘引导元素生成方法生成前景或背景元素图像。
- 可以设置每个前景或背景元素图像的prompt,也可以不设置,用空字符串占位。
- 前景和背景元素列表顺序对应生成背景的图层顺序均为从底至上。

示例代码
示例代码
使用须知
输入图像限制
主体图像限制
主体图像必须为带透明背景的RGBA四通道图像,即主体为彩色且背景为透明的图像。输出图像的分辨率与该图像保持一致。
- 主体图像请不要使用半透明图像,这可能导致模型混淆。
- 主体图像不要带有文字,如大段文字、表格文字、图片混合文字等。
| 正确示例(带透明背景RGBA图像) | 错误示例:半透明图像 | 错误示例:主体图像有文字 |
|---|---|---|
![]() | ![]() | ![]() |
引导图像限制
引导图像可以是RGB图像或带透明背景的RGBA图像。对于RGBA图像,Alpha通道值为0的区域不参与引导过程的生成。
前景或背景元素图像限制
每个前景或背景图像必须为带透明背景的RGBA四通道图像,分辨率和主体图像相同,如果不同则会自动缩放到和主体图像相同的分辨率。
如何查看并获取RGBA图像
- 检查图片格式。常见的RGBA格式包括png、webp等,而jpg、jpeg格式不是RGBA图像格式。
- 检查图片是否为RGBA图像。常用的方法有:
- 鼠标右键查看图像的文件属性,检查图像的通道信息。如果图像属性没有通道信息,使用图像编辑软件(如PS)进行查看。
- 使用Python脚本检查图片属性,代码见步骤3的
打印图像模式。
- 将RGB图像转化为RGBA图像。
如何切换模型版本
图像背景生成模型为wanx-background-generation-v2,如果需要切换模型版本,请设置parameters.model_version参数。
- v2:旧版模型,速度快,默认值。
- v3:新版模型,效果更好但响应速度慢,推荐切换到最新版本v3。
相关文档
- 图像背景生成API参考:查看完整的请求参数和返回参数说明。
- 图像API文档常见问题:图像模型通用问题汇总,包含模型计费与限流、接口高频报错等。




