跳转到主要内容
三方模型

GLM-智谱

本文档介绍如何在千问云平台调用智谱(ZHIPU AI)直供的模型推理服务。

本文档介绍如何在千问云平台调用智谱(ZHIPU AI)直供的模型推理服务。

服务开通

  1. 前往千问云控制台,搜索 GLM,找到智谱直供的 GLM 模型卡片,单击立即开通;
  2. 在弹窗内确认开通及授权。
完成以上步骤即可调用智谱提供的 GLM 模型服务。

快速开始

前提条件
  • 需要已开通千问云服务并完成API Key的创建
  • 如果通过SDK调用,需要安装对应SDK
ZHIPU/GLM-5.1、ZHIPU/GLM-5 支持通过 enable_thinking 参数设置思考与非思考模式:
  • 思考模式enable_thinking: true,默认):模型会输出详细的推理过程(reasoning_content
  • 非思考模式enable_thinking: false):直接输出结果,不包含推理过程
以下示例演示如何调用思考模式的 ZHIPU/GLM-5.1 模型进行文本生成。
  • OpenAI兼容
  • DashScope
enable_thinking 非 OpenAI 标准参数,OpenAI Python SDK 通过 extra_body 传入,Node.js SDK 作为顶层参数传入。
  • Python
  • Node.js
from openai import OpenAI
import os

client = OpenAI(
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
  model="ZHIPU/GLM-5.1",
  messages=[{"role": "user", "content": "1+1等于多少?"}],
  extra_body={"enable_thinking": True}
)

msg = completion.choices[0].message

if getattr(msg, "reasoning_content", None):
  print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")
  print(msg.reasoning_content or "")
print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
print(msg.content)

其它功能

模型多轮对话Function Calling联网搜索上下文缓存
ZHIPU/GLM-5.1✓(仅非思考模式)✓(支持显式与隐式缓存)
ZHIPU/GLM-5✓(仅非思考模式)✓(仅支持隐式缓存)

参数默认值

模型enable_thinkingtemperaturetop_ptop_krepetition_penalty
ZHIPU/GLM-5.1true1.00.95201.0
ZHIPU/GLM-5true1.00.95201.0

模型列表与计费

ZHIPU/GLM-5.1、ZHIPU/GLM-5 是智谱AI直供的混合推理模型,适用于智能交互、企业应用及开发辅助等场景。 模型上下文长度与价格信息请参见千问云控制台。 按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。

错误码

如果执行报错,请参见错误码文档进行解决。