通过API调用小米直供的 MiMo 系列模型进行对话。
快速开始
mimo-v2.5-pro 是小米直供的混合推理模型,默认开启思考模式(enable_thinking默认为true),如需直接输出结果可显式传入enable_thinking: false。运行以下代码快速调用思考模式的 mimo-v2.5-pro 模型。
需要已获取API Key并完成环境配置。如果通过SDK调用,需要安装 OpenAI SDK。
- Python
- Node.js
- HTTP
enable_thinking非 OpenAI 标准参数,OpenAI Python SDK 通过 extra_body传入,Node.js SDK 作为顶层参数传入。示例代码
返回结果
其它功能
| 功能 | 支持情况 | 备注 |
|---|---|---|
| 多轮对话 | ✓ | 思考模式下需在每轮 assistant 消息中保留 reasoning_content 字段,否则会报错 |
| Function Calling | ✓ | tool_choice 仅支持 auto;工具函数名只能包含 a-z、A-Z、0-9、下划线、连字符,最大长度 64 |
| 上下文缓存 | ✓ | 隐式缓存,自动开启 |
| 结构化输出 | ✓ | response_format不支持 json_schema |
| 联网搜索 | — | — |
| 代码解释器 | — | — |
| 多模态输入 | — | — |
top_k、reasoning_effort、thinking_budget、modalities、repetition_penalty、vl_high_resolution_images、preserve_thinking、tool_stream、enable_code_interpreter、parallel_tool_calls、seed、logprobs、top_logprobs、n、audio、enable_search、search_options、X-DashScope-DataInspection、skill。
支持的参数中,部分参数取值范围与功能与千问云不一致:
| 参数 | 千问云 | MiMo |
|---|---|---|
temperature | 范围为 [0, 2) | 范围 [0, 1.5],默认 1.0 |
top_p | 范围为 (0, 1.0] | 范围 [0.01, 1.0],默认 0.95 |
presence_penalty | — | 范围为 [-2, 2],默认值为 0 |
stop | — | 最多 4 个序列 |
max_tokens | 不限制模型思维链长度,仅限制输出长度 | 限制模型的输出和思维链长度 |
模型列表与计费
MiMo 系列模型是小米直供的混合推理模型,提供思考与非思考两种模式。
模型上下文长度与价格信息请参见千问云控制台。
按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。
错误码
MiMo 系列模型由小米直供,其错误码与千问云平台标准错误码存在差异。调用 MiMo 模型时,请以下表为准。
| 错误码 | 错误原因 | 解决方法 |
|---|---|---|
| 400 - 格式错误 | 请求体格式错误 | 检查 JSON 格式是否正确;检查是否包含所有必需参数;检查参数值是否在有效范围内;检查消息格式是否符合接口要求;检查字段是否输入正确;多轮对话思考模式下,需完整回传 reasoning_content 字段给接口 |
| 401 - 认证失败 | 缺少或无效的 API Key,或 Authorization 请求头格式错误 | 检查 API Key 及请求头格式是否正确 |
| 402 - 余额不足 | 账户余额不足 | 检查账户余额,及时进行充值 |
| 403 - 拒绝访问 | 服务暂不支持当前地区,或 API Key 被风控 | 新建 API Key,并注意输入内容安全 |
| 404 - 资源未找到 | 接口或模型不支持图像输入能力 | 确认使用的模型或接口是否支持多模态图像输入 |
| 421 - 内容拦截 | 内容审核拦截 | 避免输入不安全或敏感内容 |
| 429 - 请求超限 | 请求过于频繁 | 实现指数退避和重试逻辑,或降低请求频率 |
| 500 - 服务器失败 | 服务器内部故障 | 请稍后重试,或联系我们解决 |
| 503 - 服务器故障 | 服务器负载过高 | 请稍后重试 |

