本文档介绍如何在千问云平台调用智谱(ZHIPU AI)直供的模型推理服务。
本文档介绍如何在千问云平台调用智谱(ZHIPU AI)直供的模型推理服务。
前提条件
ZHIPU/GLM-5.1、ZHIPU/GLM-5 是智谱AI直供的混合推理模型,适用于智能交互、企业应用及开发辅助等场景。
模型上下文长度与价格信息请参见千问云控制台。
按照模型的输入与输出 Token 计费。
如果执行报错,请参见错误码文档进行解决。
服务开通
- 前往千问云控制台,搜索 GLM,找到智谱直供的 GLM 模型卡片,单击立即开通;
- 在弹窗内确认开通及授权。
快速开始
前提条件
- 需要已开通千问云服务并完成API Key的创建
- 如果通过SDK调用,需要安装对应SDK
enable_thinking 参数设置思考与非思考模式:
- 思考模式(
enable_thinking: true,默认):模型会输出详细的推理过程(reasoning_content) - 非思考模式(
enable_thinking: false):直接输出结果,不包含推理过程
- OpenAI兼容
- DashScope
enable_thinking 非 OpenAI 标准参数,OpenAI Python SDK 通过 extra_body 传入,Node.js SDK 作为顶层参数传入。- Python
- Node.js
其它功能
| 模型 | 多轮对话 | Function Calling | 联网搜索 | 上下文缓存 |
|---|---|---|---|---|
| ZHIPU/GLM-5.1 | ✓ | ✓ | ✓(仅非思考模式) | ✓(支持显式与隐式缓存) |
| ZHIPU/GLM-5 | ✓ | ✓ | ✓(仅非思考模式) | ✓(仅支持隐式缓存) |
参数默认值
| 模型 | enable_thinking | temperature | top_p | top_k | repetition_penalty |
|---|---|---|---|---|---|
| ZHIPU/GLM-5.1 | true | 1.0 | 0.95 | 20 | 1.0 |
| ZHIPU/GLM-5 | true | 1.0 | 0.95 | 20 | 1.0 |
模型列表与计费
ZHIPU/GLM-5.1、ZHIPU/GLM-5 是智谱AI直供的混合推理模型,适用于智能交互、企业应用及开发辅助等场景。
模型上下文长度与价格信息请参见千问云控制台。
按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。

