跳转到主要内容
背景生成

图像背景生成 — 创建任务

提交图像背景生成异步任务

POST
/services/aigc/background-generation/generation/
cURL
curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/background-generation/generation/' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
  "model": "wanx-background-generation-v2",
  "input": {
    "base_image_url": "https://vision-poster.oss-cn-shanghai.aliyuncs.com/lllcho.lc/data/test_data/images/main_images/new_main_img/a.png",
    "ref_image_url": "http://vision-poster.oss-cn-shanghai.aliyuncs.com/lllcho.lc/data/test_data/images/ref_images/c5e50d27be534709817b2ab080b0162f_0.jpg",
    "ref_prompt": "山脉和晚霞",
    "reference_edge": {
      "foreground_edge": [
        "https://vision-poster.oss-cn-shanghai.aliyuncs.com/lllcho.lc/data/test_data/images/huaban_soft_edge/6cdd13941cef1b11d885aea1717b983ae566b8efc9094-vcsvxa_fw658webp.png",
        "http://vision-poster.oss-cn-shanghai.aliyuncs.com/lllcho.lc/data/test_data/images/ref_edge/2c36cc4b7da027279e87311dac48fc2d5d784b1e72c0e-x4f1wC_fw658webp.png"
      ],
      "background_edge": [
        "http://vision-poster.oss-cn-shanghai.aliyuncs.com/lllcho.lc/data/test_data/images/ref_edge/0718a9741e07c52ca5506e75c4f2b99e22fff68a4c7d3-P9WGLr_fw658webp.png"
      ],
      "foreground_edge_prompt": [
        "粉色桃花",
        "可爱小狗"
      ],
      "background_edge_prompt": [
        "树叶"
      ]
    }
  },
  "parameters": {
    "n": 4,
    "ref_prompt_weight": 0.5,
    "model_version": "v3"
  }
}'
{
  "output": {
    "task_status": "PENDING",
    "task_id": "0385dc79-5ff8-4d82-bcb6-xxxxxx"
  },
  "request_id": "4909100c-7b5a-9f92-bfe5-xxxxxx"
}

模型概览

模型简介
模型名模型简介
wanx-background-generation-v2Wan-图像背景生成模型,为主体商品生成背景图,适用于电商和海报场景。支持多种背景生成方法:文本引导、图像引导、文本与图像结合引导,以及文本、图像与边缘引导元素的综合应用。
计费与限流
模型名计费单价任务下发接口 QPS 限制同时处理中任务数量免费额度
wanx-background-generation-v20.08元/张21500张

边缘引导元素生成方法

边缘引导元素生成方法因其能够有效保留图像中的边缘和结构信息,在图像背景生成任务中常用于生成前景或背景元素图像。 步骤1:PS 抠图,导出带透明背景的 4 通道格式图像。 步骤2:生成边缘引导元素图像。 针对步骤2,提供两种方案,任选一种即可。 方案一:ModelScope 在线生成 访问 ModelScope 背景图 edge 元素生成,直接上传第一步抠图后的图像点击运行即可获得符合要求的元素图像。 方案二:使用代码本地生成 安装依赖包:
pip install controlnet-aux==0.0.7
运行以下 Python 脚本生成边缘引导元素:
import numpy as np
from PIL import Image
from controlnet_aux.processor import Processor

hed_processor = Processor('softedge_hed')


def make_elements(name):
  img=Image.open(name)
  img=np.array(img)
  img[:,:,:-1]=img[:,:,:-1]*(img[:,:,-1:]>127)
  img=Image.fromarray(img,mode='RGBA')
  r,g,b,a=img.split()
  img=Image.merge(mode='RGB',bands=[r,g,b])
  edge = hed_processor(img, to_pil=True).resize(img.size).convert('RGB')
  edge.putalpha(a)
  edge=np.array(edge)
  edge[:,:,:-1]=edge[:,:,:-1]*(edge[:,:,-1:]>50)
  edge=Image.fromarray(edge,mode='RGBA')
  edge.save('result.png')


# 使用方法:将步骤1导出的前景图路径传入
make_elements('foreground.png')

错误码

大模型服务通用状态码请查阅错误信息 本模型还有如下特定错误码:
HTTP 返回码错误码(code)错误信息(message)含义说明
400InvalidParameter.DataInspectionDownload the media resource timed out during the data inspection process.可能原因:图片所属服务器不稳定,导致下载超时

常见问题

wanx-background-generation-v3 模型不存在

报错场景:如果将 model 参数设置为 wanx-background-generation-v3,发送请求后报错显示模型不存在。
{
    "code": "InvalidParameter",
    "message": "Model not exist.",
    "request_id": "539f3cf9-9b9c-9a0f-988f-1829c7eb502f"
}
原因及解决方案:目前图像背景生成只有 wanx-background-generation-v2 这一个模型。如果需要切换 V3 模型,请设置 parameters.model_versionv3,才能成功调用 v3 模型。

使用示例图片报错提示需要提供 RGBA 模式的图片

报错场景:将文档的示例图片下载到本地后重新上传,使用新链接请求时报错图像格式是 RGB 而非 RGBA。
{
    "request_id": "8f7d6829-281a-9270-944b-xxxxxx",
    "output": {
        "task_id": "72a2d266-6822-4165-a6e4-xxxxxx",
        "task_status": "FAILED",
        "submit_time": "2024-11-07 09:51:19.xxx",
        "scheduled_time": "2024-11-07 09:51:19.xxx",
        "end_time": "2024-11-07 09:51:20.xxx",
        "code": "BadRequest.UnsupportedFileFormat",
        "message": "Base image require RGBA format, but is RGB, modes concept see https://pillow.readthedocs.io/en/stable/handbook/concepts.html#concept-modes"
    },
    "usage": {
        "image_count": 0
    }
}
主要原因:主体图像、前景元素图像或背景元素图像不是 RGBA 图像。图片从示例链接下载后再上传的过程中可能改变原始格式,例如:下载时使用不支持透明度的格式(如 .jpg、.jpeg)、上传至存储服务器时不支持 RGBA 格式,或图像编辑工具未保留透明度。 解决方案:确保图像保存为支持 RGBA 透明通道的格式(如 .png),并在整个上传流程中保留透明度信息。

鉴权

string
header
必填

千问云 API Key。详见获取 API Key

Header 参数

enum<string>
必填

请求内容类型,必须设置为 application/json。

application/json
string
必填

千问云 API Key。详见获取 API Key

enum<string>
必填

异步处理配置参数。HTTP 请求只支持异步,必须设置为 enable。缺少此请求头将报错:"current user api does not support synchronous calls"。

enable
string

千问云业务空间 ID。示例值:llm-xxxx。主账号 API-Key 可不填;RAM 子账号 API-Key 必填。

请求体

application/json
enum<string>
必填

模型名称。当前仅支持填写 wanx-background-generation-v2。通过 parameters.model_version 参数切换 v2/v3 版本,请勿将 model 设置为 wanx-background-generation-v3。

wanx-background-generation-v2
wanx-background-generation-v2
object
必填

输入图像的基本信息。ref_image_url 和 ref_prompt 至少需要填写一个。

object

图像处理参数。

响应

200-application/json
string

请求唯一标识。可用于请求明细溯源和问题排查。

4909100c-7b5a-9f92-bfe5-xxxxxx
object

任务输出信息。