部署概览
在千问云上部署自定义模型,为生产工作负载创建专属推理服务。
前提条件
创建部署
前往部署页面,点击创建部署打开向导。1. 基本信息
- 部署名称:输入名称以标识此部署。
- 选择模型:从下拉菜单中选择可部署的模型。
- 模式代码:查看并可选自定义 API 调用时使用的模式代码后缀。
2. 配置
- 计费方式:选择部署的计费方式(如按 Token 计费)。
- 付费类型:选择付费类型(如按量付费)。
3. 费用估算
审核费用估算——计费方式、付费类型和 Token 定价——然后点击创建部署提交。创建后
提交后,部署进入部署中状态。配置通常需要几分钟。当状态变为运行中时,部署即可接收推理请求。调用已部署的模型
将部署的模式代码作为 chat completions API 的model 参数。在 部署页面的部署名称下方找到模式代码。
- OpenAI-compatible (Python)
- curl
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("DASHSCOPE_API_KEY"),
base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
model="your-deployment-model-code", # 替换为您的部署模式代码
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain quantum computing in simple terms."},
],
)
print(completion.choices[0].message.content)
curl "https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "your-deployment-model-code",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain quantum computing in simple terms."}
]
}'
下一步
- 管理部署 -- 监控、停止和删除您的部署。
curl --location 'https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation' \
--header 'Content-Type: application/json' \
--header "Authorization: Bearer $DASHSCOPE_API_KEY" \
--data '{
"model": "z-image-turbo",
"input": {
"messages": [
{
"role": "user",
"content": [
{
"text": "A sitting orange cat with a happy expression, lively and cute, realistic and accurate"
}
]
}
]
},
"parameters": {
"prompt_extend": false,
"size": "1024*1024"
}
}'{
"output": {
"choices": [
{
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": [
{
"image": "https://dashscope-result-bj.oss-cn-beijing.aliyuncs.com/xxx.png?Expires=xxx"
},
{
"text": "Photo of a stylish young woman..."
}
],
"reasoning_content": ""
}
}
]
},
"usage": {
"width": 1024,
"height": 1024,
"image_count": 1,
"input_tokens": 0,
"output_tokens": 0,
"total_tokens": 0
},
"request_id": "abf1645b-b630-433a-92f6-xxxxxx"
}鉴权
千问云 API Key。详见获取 API Key。
请求体
application/json模型名称。
输入内容。
显示子属性
显示子属性
请求内容数组。仅支持单轮对话,传入一条 role: user 的消息,不支持多轮。
图像生成参数。
显示子属性
显示子属性
输出图像分辨率,格式为 宽*高。范围:512×512 至 2048×2048 像素,推荐范围:1024×1024 至 1536×1536。默认值:1024*1536。
推荐分辨率(总像素约 1024×1024):1024*1024(1:1)、832*1248(2:3)、1248*832(3:2)、864*1152(3:4)、1152*864(4:3)、720*1280(9:16)、1280*720(16:9)。
推荐分辨率(总像素约 1280×1280):1280*1280(1:1)、1024*1536(2:3)、1536*1024(3:2)、1104*1472(3:4)、1472*1104(4:3)、864*1536(9:16)、1536*864(16:9)。
推荐分辨率(总像素约 1536×1536):1536*1536(1:1)、1248*1872(2:3)、1872*1248(3:2)、1296*1728(3:4)、1728*1296(4:3)、1152*2048(9:16)、2048*1152(16:9)。
开启基于大模型的智能提示词改写。
false(默认):返回图像和原始提示词,不产生额外费用。true:返回图像、优化后的提示词及推理内容,会增加响应时间和费用。
用于控制生成结果可复现性的随机种子。有效范围:[0, 2147483647]。相同种子通常生成相似结果;不填时使用随机种子。
注意: 图像生成具有随机性,即使使用相同种子,结果也可能存在差异。
响应
模型输出。
显示子属性
显示子属性
模型输出内容,数组中包含一个元素。
显示子属性
显示子属性
生成结束原因。stop 表示成功。
请求唯一标识符,可用于追踪和排查问题。

