跳转到主要内容
部署

管理部署

在千问云上监控和管理模型部署的生命周期。

部署列表

前往千问云控制台的部署页面查看工作区中的所有部署。
  • 按名称搜索
每条记录显示:
字段说明
任务部署服务的名称
模型部署使用的模型
计费方式Token 计费 / 按模型单元(MU)/ 按预置吞吐(PTU)
状态当前部署状态
更新时间最近一次状态变更时间
操作可执行的操作按钮

部署详情

点击详情打开详情页,包含两个标签页。

概览

展示部署的配置和计费信息:
  • 基础信息 -- 服务名称、状态、创建/更新时间戳和基础模型。
  • 计费信息 -- 计费方式和付费类型。
  • 部署配置 -- 模型代码和服务限流(RPM 和 TPM)。

监控

提供实时和历史性能指标:
  • 摘要统计 -- 模型总数、总调用次数、失败次数、平均 TTFT(首 Token 时间)和平均延迟。
  • RPM / TPM 图表 -- 每分钟请求数和每分钟 Token 数随时间变化。
  • TTFT / 延迟图表 -- 首 Token 时间和端到端延迟随时间变化。

部署状态

状态说明
部署中资源正在配置中。部署尚未就绪,无法推理。
运行中部署运行中,正在接受推理请求。计费生效。
已停止部署已手动停止。不计费。
异常部署在配置或运行时遇到错误。请检查模型和计费配置,必要时删除并重新创建。

操作

部署列表的操作列提供以下操作:
  • 详情 -- 查看部署的配置、计费信息和监控指标。
  • 删除 -- 永久移除部署。此操作不可撤销。
删除部署不可逆。服务将立即关闭,所有关联资源将被释放。

欠费与到期

后付费欠费:账户欠费后,部署资源保留并继续计费 24 小时,期间服务正常可用。超过 24 小时后停止计费,部署进入欠费状态,底层资源释放,但部署任务记录保留。 预付费到期:订单到期后延后 2 小时停止服务,停止后资源保留 14 小时,之后释放。预付费订单无法提前终止。
MU 预付费在首月内提前退订时,日单价按 1.2 倍计算。