创建图像生成任务 - 千问 AI 平台

POST

/services/aigc/image-generation/generation

curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/image-generation/generation' \
--header 'X-DashScope-Async: enable' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--header 'Content-Type: application/json' \
--data '{
    "model": "kling/kling-v3-image-generation",
    "input": {
        "messages": [
            {
                "role": "user",
                "content": [
                    {
                        "text": "一间有着精致窗户的花店,漂亮的木质门,摆放着花朵"
                    }
                ]
            }
        ]
    },
    "parameters": {
        "n": 2,
        "aspect_ratio": "1:1",
        "resolution": "1k"
    }
}'

{
  "code": "InvalidApiKey",
  "message": "No API-key provided.",
  "request_id": "7438d53d-6eb8-4596-8835-xxxxxx"
}

鉴权

string

header

必填

千问 AI 平台 API Key。详见获取 API Key。

Header 参数

enum<string>

必填

异步处理配置参数。HTTP请求只支持异步，必须设置为 enable。缺少此请求头将报错："current user api does not support synchronous calls"。

可选值：enable

请求体

application/json

enum<string>

必填

模型名称。

可选值：kling/kling-v3-image-generation,kling/kling-v3-omni-image-generation

object

必填

输入参数对象。

显示子属性

object[]

必填

请求内容数组。当前仅支持单轮对话，因此数组内有且只有一个对象，该对象包含 role 和 content 两个属性。

显示子属性

enum<string>

消息的角色。此参数必须设置为 user。

可选值：user

object[]

消息内容，包含文本提示词（text）和可选的参考图像（image，支持多张）。

显示子属性

string

正向提示词，用于描述期望生成的图像内容、风格和构图。支持中英文，长度不超过2500个字符，每个汉字、字母、数字或符号计为一个字符，超过部分会自动截断。注意：仅支持传入一个text，不传或传入多个将报错。示例值：一只坐着的橘黄色的猫，表情愉悦，活泼可爱，逼真准确。

string

参考图像的URL。支持 HTTP 或 HTTPS 协议。示例值：https://xxx/xxx.png。图像限制：格式为JPEG、JPG、PNG（不支持透明通道）；宽和高的范围为[300, 8000]像素；宽高比在1:2.5 ~ 2.5:1之间；文件大小不超过10MB；参考图片数量和参考主体数量（element_list数组长度）之和不得超过10。

object[]

主体列表，用于指定需要保持的主体。参考图片数量和参考主体数量（element_list数组长度）之和不得超过10。

显示子属性

integer

传 element_list 时必填，表示主体ID。请在可灵-主体ID列表获取主体ID。参考图片数量和参考主体数量（element_list数组长度）之和不得超过10。

object

控制图像生成，比如图像张数、宽高比等。

显示子属性

integer

生成的图像张数。

kling/kling-v3-image-generation：取值范围为1～9，默认值为1。
kling/kling-v3-omni-image-generation：当且仅当 result_type=single 时生效，取值范围为1～9，默认值为1。

enum<string>

生成图像的类型。仅支持模型 kling/kling-v3-omni-image-generation。

single（默认值）：单图。批量生成时仅风格相似，无分镜关联。
series：组图。生成具有叙事/视觉连续性的分镜系列图像。

可选值：single,series

integer

组图模式下的输出张数。仅支持模型 kling/kling-v3-omni-image-generation。取值范围为2～9，默认值为4。当且仅当 result_type=series 时生效。

enum<string>

默认值"16:9"

输出图像的宽高比。示例值：16:9。

可选值：16:9,9:16,1:1

enum<string>

输出图像分辨率。

kling/kling-v3-image-generation：可选值为 1k、2k，默认值为 1k。
kling/kling-v3-omni-image-generation：可选值为 1k、2k、4k，默认值为 1k。示例值：1k。

可选值：1k,2k,4k

boolean

默认值false

是否添加水印标识。水印位于图像右下角，文案固定为"可灵AI"。

false（默认值）：不添加水印。
true：添加水印。示例值：false。

响应

4XX-application/json

string

请求失败的错误码。

string

请求失败的详细信息。

string

请求唯一标识。