Anthropic Messages API 参考

POST

/apps/anthropic/v1/messages

import anthropic
import os

client = anthropic.Anthropic(
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    base_url="https://dashscope.aliyuncs.com/apps/anthropic",
)

message = client.messages.create(
    model="qwen3.7-plus",
    max_tokens=1024,
    system="You are a helpful assistant",
    messages=[
        {
            "role": "user",
            "content": "你是谁？"
        }
    ],
    thinking={"type": "disabled"},
)

print(message.content[0].text)

{
  "id": "msg_e2898f19-fc0e-4cb3-bd9b-5b7dc4ea3bc9",
  "type": "message",
  "role": "assistant",
  "model": "qwen3.7-plus",
  "content": [
    {
      "type": "thinking",
      "thinking": "让我分析一下这个问题...",
      "signature": ""
    },
    {
      "type": "text",
      "text": "你好！我是通义千问..."
    }
  ],
  "stop_reason": "end_turn",
  "stop_sequence": null,
  "usage": {
    "input_tokens": 22,
    "output_tokens": 223,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0
  }
}

鉴权

string

header

必填

通过 x-api-key 请求头传入千问云 API Key。也支持 Authorization: Bearer 请求头，二者选其一即可。

请求体

application/json

string

必填

模型名称。支持范围如下：

千问Max：qwen3.7-max、qwen3.7-max-2026-06-08、qwen3.7-max-2026-05-20、qwen3.6-max-preview、qwen3-max、qwen3-max-2026-01-23、qwen3-max-preview

千问Plus：qwen3.6-plus、qwen3.6-plus-2026-04-02、qwen3.5-plus、qwen3.5-plus-2026-04-20、qwen3.5-plus-2026-02-15、qwen-plus、qwen-plus-latest、qwen-plus-2025-09-11

千问Flash：qwen3.6-flash、qwen3.6-flash-2026-04-16、qwen3.5-flash、qwen3.5-flash-2026-02-23、qwen-flash、qwen-flash-2025-07-28

千问Turbo：qwen-turbo、qwen-turbo-latest

千问Coder：qwen3-coder-next、qwen3-coder-plus、qwen3-coder-plus-2025-09-23、qwen3-coder-flash

千问VL：qwen3-vl-plus、qwen3-vl-flash、qwen-vl-max、qwen-vl-plus

千问开源模型：qwen3.6-27b、qwen3.5-397b-a17b、qwen3.5-122b-a10b、qwen3.5-27b、qwen3.5-35b-a3b

第三方模型：deepseek-v4-pro、deepseek-v4-flash、deepseek-v3.2、kimi-k2.7-code、kimi-k2.6、kimi-k2.5、kimi-k2-thinking、glm-5.2、glm-5.1、glm-5、glm-4.7、glm-4.6、MiniMax-M2.5、MiniMax-M2.1

integer

必填

回复内容的最大 Token 数。若生成内容超过此值，生成将提前停止，stop_reason 为 max_tokens。

max_tokens 不限制思考过程的长度。开启深度思考时，思考部分的 Token 数由 thinking.budget_tokens 单独控制。

object[]

必填

消息数组，按 user / assistant 交替轮次排列。

显示子属性

enum<string>

必填

消息角色。

可选值：user,assistant

string

必填

消息内容。可以是纯文本字符串，也可以是结构化内容数组。

string

系统提示词，用于设定模型的角色或行为。system 通过顶层参数传入，messages 数组中不接受 system 角色。传入字符串等价于单个 type="text" 的内容块。当需要为系统提示词标记显式缓存断点时，必须传入数组形式。

boolean

默认值false

是否启用流式输出，默认为 false。

number

控制生成文本的多样性，取值范围 [0, 2)。值越大，生成结果越随机。该范围与 Anthropic 官方的 [0.0, 1.0] 不同，从 Anthropic 迁移时请确认该参数取值。

number

核采样的概率阈值，控制生成文本的多样性。temperature 与 top_p 均可控制多样性，建议只设置其中一个值。

integer

生成过程中采样候选集的大小。

string[]

指定停止生成的文本序列。模型生成到该序列前会停止输出，且不包含该序列本身。命中后，响应的 stop_reason 仍为 end_turn，响应不会回填命中的序列。

object

深度思考配置。开启后，模型会在生成回复前先进行推理，以提升回答准确度。开启后，响应会包含 thinking 类型的内容块。

显示子属性

enum<string>

enabled（开启思考模式）或 disabled（关闭思考模式）。

可选值：enabled,disabled

integer

思考过程可使用的最大 Token 数，与 max_tokens 互不重叠：本参数限制思考，max_tokens 限制最终回复。预算越大，在复杂问题上的分析越充分。当 type 为 enabled 时生效。

enum<string>

控制模型的推理强度，默认为 max。支持的模型：deepseek-v4-pro、deepseek-v4-flash。设为 low 或 medium 时会映射为 high，设为 xhigh 时会映射为 max。

可选值：high,max

object[]

工具定义数组，用于 Function Call 场景。

显示子属性

string

必填

工具名称。

object

必填

工具输入参数的 JSON Schema 定义。

string

工具的功能描述。

object

工具选择策略。{"type": "auto"}：模型自行决定是否调用工具（默认）。{"type": "any"}：强制调用任意一个工具。{"type": "none"}：禁止调用工具。{"type": "tool", "name": "tool_name"}：强制调用指定工具。

显示子属性

enum<string>

策略类型。

可选值：auto,any,none,tool

string

当 type 为 tool 时，指定要调用的工具名称。

object

结构化输出配置。启用后，模型返回 JSON 字符串。不同模型行为有差异：

严格结构化输出：适用于 deepseek 和 glm 系列模型。模型严格遵循提供的 JSON Schema，保证字段类型和层级一致。
常规结构化输出：适用于其他所有模型，不会强制约束 schema 字段，API 会自动降级为普通 JSON 模式（仅保证输出为合法的 JSON 字符串）。在此降级模式下，请求必须同时满足以下两点：(1) 显式提供 output_config 参数；(2) system 或 messages 内容中包含关键词 "JSON"（不区分大小写）。若缺少关键词 "JSON"，API 会抛出错误：'messages' must contain the word 'json' in some form。

显示子属性

object

必填

输出格式定义。

显示子属性

enum<string>

必填

固定值：json_schema。

可选值：json_schema

object

必填

遵循标准 JSON Schema 规范的 JSON Schema 对象。应包含 type（数据类型）、properties（字段定义）、required（必填字段名数组）和 additionalProperties（必须设为 false）等字段。

响应

200-application/json

string

消息的唯一标识。

enum<string>

固定为 message。

可选值：message

enum<string>

固定为 assistant。

可选值：assistant

string

使用的模型名称。

object[]

内容数组，元素类型可为 text（文本信息）、thinking（思考信息，开启深度思考时返回）或 tool_use（工具调用信息）。

显示子属性

enum<string>

内容块类型。

可选值：text,thinking,tool_use

string

text 类型时的模型生成文本回复。

string

thinking 类型时的模型思考过程。

string

thinking 类型时的签名，当前固定为空字符串。

string

tool_use 类型时的工具调用唯一标识。

string

tool_use 类型时被调用的工具名称。

object

tool_use 类型时的工具调用入参。

enum<string>

停止原因：end_turn（正常结束）、max_tokens（达到 Token 上限）、tool_use（工具调用）。

可选值：end_turn,max_tokens,tool_use

string | null

固定为 null。

object

Token 用量统计。流式调用中，message_start 事件的 usage 仅包含 input_tokens 和 output_tokens；完整 4 个字段在 message_delta 事件中返回。

显示子属性

integer

输入 Token 数量。

integer

输出 Token 数量。

integer

缓存创建消耗的输入 Token 数量。

integer

缓存读取消耗的输入 Token 数量。