本文档介绍如何在千问云平台调用月之暗面(Moonshot AI)直供的模型推理服务。
本文档介绍如何在千问云平台调用月之暗面(Moonshot AI)直供的模型推理服务。
前提条件
返回结果
kimi-k2.5、kimi-k2.6不仅支持纯文本对话,还具备强大的多模态理解能力。本章节将介绍如何让模型理解图像和视频内容。
图像理解功能让 Kimi 模型能够识别和分析图像内容。您可以传入单张或多张图像。图像文件的限制请参见文件限制。
视频文件的限制请参见文件限制。
kimi/kimi-k2.6、kimi/kimi-k2.5属于混合思考模型,通过
如果执行报错,请参见错误码文档进行解决。
服务开通
- 前往千问云控制台,搜索 Kimi,找到 Kimi 模型卡片,单击立即开通;
- 在弹窗内确认开通及授权。
快速开始
前提条件
- 需要已开通千问云服务并完成API Key的创建
- 如果通过SDK调用,需要安装对应SDK
enable_thinking 参数控制思考模式,默认开启思考模式:
- 思考模式(
enable_thinking: true):模型会输出详细的推理过程(reasoning_content) - 非思考模式(
enable_thinking: false或不设置):直接输出结果,不包含推理过程
preserve_thinking 参数在多轮对话中传递思考过程。
以下示例演示如何调用思考模式的 kimi-k2.6 模型进行文本生成。
- OpenAI兼容
enable_thinking 非 OpenAI 标准参数,OpenAI Python SDK 通过 extra_body 传入,Node.js SDK 作为顶层参数传入。- Python
- Node.js
- curl
多模态调用示例
kimi-k2.5、kimi-k2.6不仅支持纯文本对话,还具备强大的多模态理解能力。本章节将介绍如何让模型理解图像和视频内容。
图像/视频文件仅支持通过公网URL传入,不支持 Base64 编码。
图像理解
图像理解功能让 Kimi 模型能够识别和分析图像内容。您可以传入单张或多张图像。图像文件的限制请参见文件限制。
- OpenAI兼容
- Python
- Node.js
- curl
视频理解
视频文件的限制请参见文件限制。
- OpenAI兼容
- Python
- Node.js
- curl
文件限制
- 图像文件
- 视频文件
- 图像分辨率: 建议图像分辨率不超过4k (4096*2160)
- 支持的图像格式: PNG、JPEG、WEBP、GIF
- 图像大小与图像数量: 无限制,但需确保请求的文本和图像的大小不超过 100M。
其它功能
| 模型 | 流式输出 | Function Call | 思考模式 | 联网搜索 | 上下文缓存 | 工具调用 |
|---|---|---|---|---|---|---|
| kimi/kimi-k2.6 | ✓ | ✓ | ✓ | — | ✓ | ✓ |
| kimi/kimi-k2.5 | ✓ | ✓ | ✓ | — | ✓ | ✓ |
- kimi/kimi-k2.6、kimi/kimi-k2.5支持上下文缓存(隐式缓存,自动开启),kimi/kimi-k2.6命中缓存的输入Token按输入价格的16.9%计费,kimi/kimi-k2.5命中缓存的输入Token按输入价格的17.5%计费。
- 在思考模式下,使用 kimi/kimi-k2.6、kimi/kimi-k2.5 进行工具调用时:必须在每轮 assistant 消息中保留
reasoning_content字段,tool_choice也仅支持"auto"(默认)和"none",否则会报错。
参数默认值
| 模型 | stream_options | temperature | top_p | repetition_penalty | presence_penalty | tool_choice | top_k |
|---|---|---|---|---|---|---|---|
| kimi/kimi-k2.6 | 仅支持设置为true | 思考模式:1.0;非思考模式:0.6 | 0.95 | 0.0 | 0.0 | auto | - |
| kimi/kimi-k2.5 | 仅支持设置为true | 思考模式:1.0;非思考模式:0.6 | 0.95 | 0.0 | 0.0 | auto | - |
stream_options仅支持设置为true,temperature、top_p、repetition_penalty、presence_penalty不支持设置为其他值;- 在思考模式下,不支持强制调用某个工具,
tool_choice仅支持设置为auto(默认值)和none。 - "-"表示没有默认值,也不支持设置。
模型列表与计费
kimi/kimi-k2.6、kimi/kimi-k2.5属于混合思考模型,通过 enable_thinking 参数控制是否开启思考模式(注意:无法通过 thinking_budget 限制思考长度)。
模型上下文长度与价格信息请参见千问云控制台。
按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。

