跳转到主要内容
三方模型

MiMo-小米

通过API调用小米直供的 MiMo 系列模型进行对话。

快速开始

mimo-v2.5-pro 是小米直供的混合推理模型,默认开启思考模式(enable_thinking默认为true),如需直接输出结果可显式传入enable_thinking: false。运行以下代码快速调用思考模式的 mimo-v2.5-pro 模型。 需要已获取API Key并完成环境配置。如果通过SDK调用,需要安装 OpenAI SDK。
  • Python
  • Node.js
  • HTTP
enable_thinking非 OpenAI 标准参数,OpenAI Python SDK 通过 extra_body传入,Node.js SDK 作为顶层参数传入。

示例代码

from openai import OpenAI
import os

client = OpenAI(
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "1+1 等于多少?"}]
completion = client.chat.completions.create(
  model="xiaomi/mimo-v2.5-pro",
  messages=messages,
  stream=True,
  stream_options={
    "include_usage": True
  },
)

reasoning_content = ""
answer_content = ""
is_answering = False
print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")

for chunk in completion:
  if not chunk.choices:
    print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
    print(chunk.usage)
    continue

  delta = chunk.choices[0].delta

  if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
    if not is_answering:
      print(delta.reasoning_content, end="", flush=True)
    reasoning_content += delta.reasoning_content

  if hasattr(delta, "content") and delta.content:
    if not is_answering:
      print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
      is_answering = True
    print(delta.content, end="", flush=True)
    answer_content += delta.content

返回结果

====================思考过程====================

用户问了一个简单的算术问题:1+1等于多少。
这是最基础的加法运算,答案是 2。我直接给出答案并简要说明即可。
====================完整回复====================

1+1 等于 2。这是最基本的加法运算。
====================Token 消耗====================

CompletionUsage(completion_tokens=42, prompt_tokens=9, total_tokens=51, prompt_tokens_details={'cached_tokens': 0})

其它功能

功能支持情况备注
多轮对话思考模式下需在每轮 assistant 消息中保留 reasoning_content 字段,否则会报错
Function Callingtool_choice 仅支持 auto;工具函数名只能包含 a-z、A-Z、0-9、下划线、连字符,最大长度 64
上下文缓存隐式缓存,自动开启
结构化输出response_format不支持 json_schema
联网搜索
代码解释器
多模态输入
mimo-v2.5-pro 不支持以下参数:top_kreasoning_effortthinking_budgetmodalitiesrepetition_penaltyvl_high_resolution_imagespreserve_thinkingtool_streamenable_code_interpreterparallel_tool_callsseedlogprobstop_logprobsnaudioenable_searchsearch_optionsX-DashScope-DataInspectionskill 支持的参数中,部分参数取值范围与功能与千问云不一致:
参数千问云MiMo
temperature范围为 [0, 2)范围 [0, 1.5],默认 1.0
top_p范围为 (0, 1.0]范围 [0.01, 1.0],默认 0.95
presence_penalty范围为 [-2, 2],默认值为 0
stop最多 4 个序列
max_tokens不限制模型思维链长度,仅限制输出长度限制模型的输出和思维链长度

模型列表与计费

MiMo 系列模型是小米直供的混合推理模型,提供思考与非思考两种模式。 模型上下文长度与价格信息请参见千问云控制台 按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。

错误码

MiMo 系列模型由小米直供,其错误码与千问云平台标准错误码存在差异。调用 MiMo 模型时,请以下表为准。
错误码错误原因解决方法
400 - 格式错误请求体格式错误检查 JSON 格式是否正确;检查是否包含所有必需参数;检查参数值是否在有效范围内;检查消息格式是否符合接口要求;检查字段是否输入正确;多轮对话思考模式下,需完整回传 reasoning_content 字段给接口
401 - 认证失败缺少或无效的 API Key,或 Authorization 请求头格式错误检查 API Key 及请求头格式是否正确
402 - 余额不足账户余额不足检查账户余额,及时进行充值
403 - 拒绝访问服务暂不支持当前地区,或 API Key 被风控新建 API Key,并注意输入内容安全
404 - 资源未找到接口或模型不支持图像输入能力确认使用的模型或接口是否支持多模态图像输入
421 - 内容拦截内容审核拦截避免输入不安全或敏感内容
429 - 请求超限请求过于频繁实现指数退避和重试逻辑,或降低请求频率
500 - 服务器失败服务器内部故障请稍后重试,或联系我们解决
503 - 服务器故障服务器负载过高请稍后重试