跳转到主要内容
三方模型

MiniMax-稀宇科技

本文档介绍如何在千问云平台调用稀宇科技(简称MiniMax)直供的模型推理服务。

服务开通

  1. 前往千问云控制台,搜索 MiniMax,找到 MiniMax 模型卡片,单击立即开通;
  2. 在弹窗内确认开通及授权。
完成以上步骤即可调用MiniMax提供的 MiniMax 模型服务。

快速开始

API 使用前提:已开通服务并完成API Key配置。如果通过SDK调用,需要安装SDK。
  • OpenAI兼容
  • DashScope
  • Python
  • Node.js
  • HTTP

示例代码

import os
from openai import OpenAI

client = OpenAI(
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
  model="MiniMax/MiniMax-M2.7",
  messages=[{"role": "user", "content": "你是谁"}],
  stream=True,
)

reasoning_content = ""  # 完整思考过程
answer_content = ""     # 完整回复
is_answering = False    # 是否进入回复阶段

print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")

for chunk in completion:
  if chunk.choices:
    delta = chunk.choices[0].delta
    # 只收集思考内容
    if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
      if not is_answering:
        print(delta.reasoning_content, end="", flush=True)
      reasoning_content += delta.reasoning_content
    # 收到content,开始进行回复
    if hasattr(delta, "content") and delta.content:
      if not is_answering:
        print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
        is_answering = True
      print(delta.content, end="", flush=True)
      answer_content += delta.content

返回结果

====================思考过程====================

用户问我是谁。根据系统提示,我应该以"MiniMax-M2.7"的身份回应,并且提到我是由MiniMax公司开发的。

这是一个简单的自我介绍问题,我应该简洁明了地回答。

====================完整回复====================


你好!我是 **MiniMax-M2.7**,由 **MiniMax** 公司开发的AI助手。

我可以帮助你回答问题、提供信息、进行对话等各种任务。有什么我可以帮助你的吗?

其它功能

模型流式输出系统消息联网搜索工具调用结构化输出文件提取上下文缓存
MiniMax/MiniMax-M2.7
MiniMax/MiniMax-M2.5
MiniMax/MiniMax-M2.1
上下文缓存类型为隐式缓存,自动开启,与千问云的隐式缓存服务有以下不同:
  • MiniMax/MiniMax-M2.7 命中缓存的输入 Token 折扣为 20%,MiniMax/MiniMax-M2.5、MiniMax/MiniMax-M2.1 折扣为 10%;
  • 缓存最少 Token 数为 512(千问云为 256)。

参数默认值

当前不支持修改以下参数。
模型temperaturetop_p
MiniMax/MiniMax-M2.71.00.9
MiniMax/MiniMax-M2.51.00.9
MiniMax/MiniMax-M2.11.00.9

模型列表与计费

MiniMax-M2.7 模型,擅长编程、文本摘要等任务,推荐使用。 模型上下文长度与价格信息请参见千问云控制台 按照模型的输入与输出 Token 数量计费。

错误码

如果模型调用失败并返回报错信息,请参见错误码文档进行解决。