部署列表
前往千问云控制台的部署页面查看工作区中的所有部署。
每条记录显示:
| 字段 | 说明 |
|---|
| 任务 | 部署服务的名称 |
| 模型 | 部署使用的模型 |
| 计费方式 | Token 计费 / 按模型单元(MU)/ 按预置吞吐(PTU) |
| 状态 | 当前部署状态 |
| 更新时间 | 最近一次状态变更时间 |
| 操作 | 可执行的操作按钮 |
部署详情
点击详情打开详情页,包含两个标签页。
展示部署的配置和计费信息:
- 基础信息 -- 服务名称、状态、创建/更新时间戳和基础模型。
- 计费信息 -- 计费方式和付费类型。
- 部署配置 -- 模型代码和服务限流(RPM 和 TPM)。
提供实时和历史性能指标:
- 摘要统计 -- 模型总数、总调用次数、失败次数、平均 TTFT(首 Token 时间)和平均延迟。
- RPM / TPM 图表 -- 每分钟请求数和每分钟 Token 数随时间变化。
- TTFT / 延迟图表 -- 首 Token 时间和端到端延迟随时间变化。
部署状态
| 状态 | 说明 |
|---|
| 部署中 | 资源正在配置中。部署尚未就绪,无法推理。 |
| 运行中 | 部署运行中,正在接受推理请求。计费生效。 |
| 已停止 | 部署已手动停止。不计费。 |
| 异常 | 部署在配置或运行时遇到错误。请检查模型和计费配置,必要时删除并重新创建。 |
部署列表的操作列提供以下操作:
- 详情 -- 查看部署的配置、计费信息和监控指标。
- 删除 -- 永久移除部署。此操作不可撤销。
删除部署不可逆。服务将立即关闭,所有关联资源将被释放。
欠费与到期
后付费欠费:账户欠费后,部署资源保留并继续计费 24 小时,期间服务正常可用。超过 24 小时后停止计费,部署进入欠费状态,底层资源释放,但部署任务记录保留。
预付费到期:订单到期后延后 2 小时停止服务,停止后资源保留 14 小时,之后释放。预付费订单无法提前终止。
MU 预付费在首月内提前退订时,日单价按 1.2 倍计算。