跳转到主要内容
部署

管理部署

在千问云上监控、扩缩和管理模型部署的生命周期。

部署列表

前往千问云控制台的部署页面查看工作区中的所有部署。
  • 按名称搜索
每条记录显示任务名称、模型、计费方式、状态、更新时间和可用操作。

部署详情

点击详情打开详情页,包含两个标签页。

概览

展示部署的配置和计费信息:
  • 基础信息 -- 服务名称、状态、创建/更新时间戳和基座模型。
  • 计费信息 -- 计费方式和付费类型。
  • 部署配置 -- 模式代码和服务限流(RPM 和 TPM)。

监控

提供实时和历史性能指标:
  • 摘要统计 -- 模型总数、总调用次数、失败次数、平均 TTFT(首 Token 时间)和平均延迟。
  • RPM / TPM 图表 -- 每分钟请求数和每分钟 Token 数随时间变化。
  • TTFT / 延迟图表 -- 首 Token 时间和端到端延迟随时间变化。

部署状态

状态说明
部署中资源正在配置中。部署尚未就绪,无法推理。
运行中部署运行中,正在接受推理请求。计费生效。
已停止部署已手动停止。不计费。
异常部署在配置或运行时遇到错误。

操作

您可以在部署列表或详情页执行以下操作:
  • 试用 -- 直接在控制台发送测试推理请求。
  • 停止 -- 暂停部署。停止后不计费。
  • 启动 -- 恢复已停止的部署。状态恢复为运行中后计费恢复。
  • 删除 -- 永久移除部署。此操作不可撤销。
删除部署不可逆。服务将立即关闭,所有关联资源将被释放。

扩缩容

您无需重新创建服务即可调整部署容量。打开部署详情页,修改容量设置。更改将在几分钟内生效。
管理部署 - 千问云