MLOps 与可观测性

概述

千问云为模型部署提供两项互补的可观测性功能：

前往用量分析页面查看业务空间的用量和分析数据。

页面展示以下关键指标：

此外还展示请求数、平均首包延迟、平均延迟和成功率的趋势图。

费用包含整个平台的所有消耗，具体请参考账单数据。

切换到日志页签，可查看近 14 天的请求调用日志。 筛选条件：

日志字段：

点击详情可查看单次请求的完整信息。支持导出功能，将日志数据导出为文件。

类型	子类别	单位	计费方式
大语言模型	文本生成、深度思考、视觉理解	Token	按输入和输出 Token 数计费
视觉模型	图像生成	张（数量）	按成功生成的图片数计费
视觉模型	视频生成	秒	按成功生成的视频时长计费
语音模型	TTS、实时 TTS、文件 ASR、实时 ASR、音视频翻译	秒、字符或 Token	因模型而异——可能按音频时长、文本字符数或 Token 数计费
全模态模型	全模态、实时多模态	Token	文本按 Token 计费；其他模态（音频、图像、视频）按对应 Token 数计费

前往限流提额页面管理模型的频率限制提升。点击临时提升频率限制提交申请，下方表格可查看历史申请状态。