在千问云上监控、扩缩和管理模型部署的生命周期。
部署列表
前往千问云控制台的部署页面查看工作区中的所有部署。
- 按名称搜索。
部署详情
点击详情打开详情页,包含两个标签页。
概览
展示部署的配置和计费信息:
- 基础信息 -- 服务名称、状态、创建/更新时间戳和基座模型。
- 计费信息 -- 计费方式和付费类型。
- 部署配置 -- 模式代码和服务限流(RPM 和 TPM)。
监控
提供实时和历史性能指标:
- 摘要统计 -- 模型总数、总调用次数、失败次数、平均 TTFT(首 Token 时间)和平均延迟。
- RPM / TPM 图表 -- 每分钟请求数和每分钟 Token 数随时间变化。
- TTFT / 延迟图表 -- 首 Token 时间和端到端延迟随时间变化。
部署状态
| 状态 | 说明 |
|---|---|
| 部署中 | 资源正在配置中。部署尚未就绪,无法推理。 |
| 运行中 | 部署运行中,正在接受推理请求。计费生效。 |
| 已停止 | 部署已手动停止。不计费。 |
| 异常 | 部署在配置或运行时遇到错误。 |
操作
您可以在部署列表或详情页执行以下操作:
- 试用 -- 直接在控制台发送测试推理请求。
- 停止 -- 暂停部署。停止后不计费。
- 启动 -- 恢复已停止的部署。状态恢复为运行中后计费恢复。
- 删除 -- 永久移除部署。此操作不可撤销。
删除部署不可逆。服务将立即关闭,所有关联资源将被释放。

