文本生成模型

做 AI 编程或 Agent 开发（OpenClaw、Claude Code、Hermes 等）该选哪个模型？

推荐 qwen3.7-plus——能力与成本均衡，完整工具调用支持，1M 上下文适合大型代码库。如需最强推理能力，可选择 qwen3.7-max。

从闭源模型迁移到千问云？

如果你正在使用 GPT、Claude 或 Gemini，可参考下表按能力档选择千问云对位模型。

	闭源模型代表	千问云推荐
高能力	GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro	`qwen3.7-max`
平衡	GPT-5.4、Claude Sonnet 4.6、Gemini 3 Pro	`qwen3.7-plus`、`deepseek-v4-pro`、`glm-5.2`
轻量低成本	GPT-5.4-mini、Claude Haiku 4.5、Gemini 3.1 Flash	`qwen3.6-flash`、`deepseek-v4-flash`、`MiniMax-M2.5`

其他应用场景

聊天机器人、内容生成、摘要总结、文档处理——首选 qwen3.7-plus，能力与成本均衡，支持 1M 上下文和完整功能集。验证效果后，可尝试 qwen3.6-flash 降低成本——接近旗舰水平，上下文长度和功能一致。如需最强推理能力，可选择 qwen3.7-max，但成本较高。

上下文窗口

1M token 约等于 75 万字或 10 本书。

长文档或大型代码库 → qwen3.7-max / qwen3.7-plus / qwen3.6-flash（1M）
常规任务 → 128k–256k 足够

思考模式

适用于多步数学推导、代码调试、架构设计、法律条文交叉引用等需要逐步推理的场景。通过 enable_thinking 开关控制。所有 Qwen3+ 模型均支持——大多数为混合模式，可按请求切换。

函数调用与内置工具

让模型执行操作：查天气、查数据库、预订会议。

函数调用（自定义工具，模型调用）：所有通用模型均支持
内置工具（联网搜索、代码解释器、网页抓取等，无需复杂配置）

批量推理

适用于大量请求且对延迟要求不高的场景，可降低请求成本。

模型	上下文	思考模式	函数调用	内置工具	结构化输出	批量
`qwen3.7-max`	1M	✓	✓	✓	—	✓
`qwen3.7-plus`	1M	✓	✓	✓	✓	✓
`qwen3.6-flash`	1M	✓	✓	✓	✓	✓
`deepseek-v4-pro`	1M	✓	✓	—	—	—
`deepseek-v4-flash`	1M	✓	✓	—	—	—
`kimi-k2.7-code`	256k	✓	✓	—	—	—
`glm-5.2`	1M	✓	✓	—	✓	—
`MiniMax-M3`	192k	✓	✓	—	—	—
`mimo-v2.5-pro`	1M	✓	✓	—	✓	—

全部模型

Qwen3.7

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`qwen3.7-max`	1M	64k	256k	✓	✓	—	✓
`qwen3.7-max-2026-06-08`	1M	64k	256k	✓	✓	—	—
`qwen3.7-max-2026-05-20`	1M	64k	256k	✓	✓	—	—
`qwen3.7-max-preview`	1M	64k	256k	✓	✓	—	—
`qwen3.7-max-2026-05-17`	1M	64k	256k	✓	✓	—	—
`qwen3.7-plus`	1M	64k	256k	✓	✓	✓	✓
`qwen3.7-plus-2026-05-26`	1M	64k	256k	✓	✓	✓	—

Qwen3.6

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`qwen3.6-plus`	1M	64k	80k	✓	✓	✓	✓
`qwen3.6-plus-2026-04-02`	1M	64k	80k	✓	✓	✓	—
`qwen3.6-flash`	1M	64k	128k	✓	✓	✓	✓
`qwen3.6-flash-2026-04-16`	1M	64k	128k	✓	✓	✓	—
`qwen3.6-35b-a3b`	256k	64k	128k	✓	✓	✓	—
`qwen3.6-27b`	256k	64k	128k	✓	✓	✓	—

Qwen3.5

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`qwen3.5-plus`	1M	64k	80k	✓	✓	✓	✓
`qwen3.5-plus-2026-02-15`	1M	64k	80k	✓	✓	✓	—
`qwen3.5-plus-2026-04-20`	1M	64k	80k	✓	✓	✓	—
`qwen3.5-flash`	1M	64k	80k	✓	✓	✓	✓
`qwen3.5-flash-2026-02-23`	1M	64k	80k	✓	✓	✓	—
`qwen3.5-397b-a17b`	256k	64k	80k	✓	✓	✓	—
`qwen3.5-122b-a10b`	256k	64k	80k	✓	✓	✓	—
`qwen3.5-27b`	256k	64k	80k	✓	✓	✓	—
`qwen3.5-35b-a3b`	256k	64k	80k	✓	✓	✓	—

第三方模型

通过同一 API 可用的非 Qwen 模型。

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`deepseek-v4-pro`	1M	384k *	384k *	✓	—	—	—
`deepseek-v4-flash`	1M	384k *	384k *	✓	—	—	—
`glm-5.2`	1M	131k	131k	✓	—	✓	—
`glm-5.1`	198k	128k	128k	✓	—	✓	—
`kimi-k2.7-code`	256k	16k	—	✓	—	—	—
`kimi-k2.6`	256k	96k	80k	✓	—	—	—
`MiniMax-M2.5`	192k	32k	32k **	✓	—	—	—
`mimo-v2.5-pro`	1M	128k	128k	✓	—	✓	—

* DeepSeek-V4 的 384k（393,216 Token）限制由思考和最终输出共享。** MiniMax-M2.5 的 32k 限制由 CoT 和最终输出共享。

旧版及其他模型

上一代模型。新项目建议使用 Qwen3.6。

Qwen3

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`qwen3-max`	256k	64k	80k	✓	✓	✓	✓
`qwen3-max-2026-01-23`	256k	64k	80k	✓	✓	✓	—
`qwen3-max-preview`	256k	64k	80k	✓	✓	✓	—
`qwen3-max-2025-09-23`	256k	64k	—	✓	✓	✓	—
`qwen3-235b-a22b`	128k	16k	38k	✓	—	✓	—
`qwen3-235b-a22b-thinking-2507`	128k	32k	80k	✓	—	—	—
`qwen3-235b-a22b-instruct-2507`	128k	32k	—	✓	—	✓	—
`qwen3-next-80b-a3b-thinking`	128k	32k	80k	✓	—	—	—
`qwen3-next-80b-a3b-instruct`	128k	32k	—	✓	—	✓	—
`qwen3-32b`	128k	16k	38k	✓	—	✓	—
`qwen3-30b-a3b`	128k	16k	38k	✓	—	✓	—
`qwen3-30b-a3b-thinking-2507`	128k	32k	80k	✓	—	—	—
`qwen3-30b-a3b-instruct-2507`	128k	32k	—	✓	—	✓	—
`qwen3-14b`	128k	8k	38k	✓	—	✓	—
`qwen3-8b`	128k	8k	38k	✓	—	✓	—
`qwen3-4b`	128k	8k	38k	✓	—	✓	—
`qwen3-1.7b`	32k	8k	30k	✓	—	✓	—
`qwen3-0.6b`	32k	8k	30k	✓	—	✓	—

Qwen3-Coder

模型	上下文	最大输出	函数调用	内置工具	结构化输出	批量
`qwen3-coder-plus`	1M	64k	✓	—	✓	—
`qwen3-coder-plus-2025-09-23`	1M	64k	✓	—	✓	—
`qwen3-coder-plus-2025-07-22`	1M	64k	✓	—	✓	—
`qwen3-coder-flash`	1M	64k	✓	—	✓	—
`qwen3-coder-flash-2025-07-28`	1M	64k	✓	—	✓	—
`qwen3-coder-next`	256k	64k	✓	—	✓	—
`qwen3-coder-480b-a35b-instruct`	256k	64k	✓	—	✓	—
`qwen3-coder-30b-a3b-instruct`	256k	64k	✓	—	✓	—

Qwen2.5（开源）

模型	上下文	最大输出	函数调用	内置工具	结构化输出	批量
`qwen2.5-omni-7b`	32k	8k	✓	—	✓	—
`qwen2.5-72b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-72b-instruct-1m`	1M	8k	✓	—	✓	—
`qwen2.5-32b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-14b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-7b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-3b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-1.5b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-0.5b-instruct`	32k	8k	✓	—	✓	—

QwQ / QVQ（开源）

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`qwq-32b`	128k	8k	32k	—	—	—	✓
`qwq-32b-preview`	32k	16k	—	—	—	—	✓

Qwen-Coder（旧版，qwen2.5之前）

模型	上下文	最大输出	函数调用	内置工具	结构化输出	批量
`qwen-coder-plus`	128k	8k	✓	—	✓	—
`qwen-coder-plus-latest`	128k	8k	✓	—	✓	—
`qwen-coder-plus-2024-11-06`	128k	8k	✓	—	✓	—
`qwen-coder-turbo`	128k	8k	✓	—	✓	—
`qwen-coder-turbo-latest`	128k	8k	✓	—	✓	—
`qwen-coder-turbo-2024-09-19`	128k	8k	✓	—	✓	—

Qwen2.5-Coder（开源）

模型	上下文	最大输出	函数调用	内置工具	结构化输出	批量
`qwen2.5-coder-32b-instruct`	128k	8k	✓	—	✓	—
`qwen2.5-coder-14b-instruct`	128k	8k	✓	—	✓	—
`qwen2.5-coder-7b-instruct`	128k	8k	✓	—	✓	—
`qwen2.5-coder-3b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-coder-1.5b-instruct`	32k	8k	✓	—	✓	—
`qwen2.5-coder-0.5b-instruct`	32k	8k	✓	—	✓	—

翻译

模型	上下文	思考模式	函数调用	内置工具	结构化输出	批量
`qwen-mt-plus`	16k	—	—	—	—	—
`qwen-mt-turbo`	16k	—	—	—	—	—
`qwen-mt-flash`	16k	—	—	—	—	—
`qwen-mt-lite`	16k	—	—	—	—	—

千问Long（长上下文）

模型	上下文	思考模式	函数调用	内置工具	结构化输出	批量
`qwen-long`	10M	—	—	—	✓	✓
`qwen-long-latest`	10M	—	—	—	✓	✓
`qwen-long-2025-01-25`	10M	—	—	—	✓	—

角色扮演

模型	上下文	思考模式	函数调用	内置工具	结构化输出	批量
`qwen-plus-character`	32k	—	—	—	—	—
`qwen-plus-character-ja`	32k	—	—	—	—	—
`qwen-flash-character`	8k	—	—	—	—	—

旧版Qwen

模型	上下文	最大输出	思考预算	函数调用	内置工具	结构化输出	批量
`qwen-plus`	1M	32k	80k	✓	—	✓	✓
`qwen-plus-latest`	1M	32k	80k	✓	—	✓	✓
`qwen-plus-2025-12-01`	1M	32k	80k	✓	—	✓	✓
`qwen-plus-2025-09-11`	1M	32k	80k	✓	—	✓	✓
`qwen-plus-2025-07-28`	1M	32k	80k	✓	—	✓	✓
`qwen-plus-2025-07-14`	128k	16k	80k	✓	—	✓	✓
`qwen-plus-2025-04-28`	128k	16k	80k	✓	—	✓	✓
`qwen-plus-2025-01-25`	128k	8k	—	✓	—	✓	✓
`qwen-plus-2025-01-12`	1M	32k	80k	✓	—	✓	✓
`qwen-plus-2024-12-20`	1M	32k	80k	✓	—	✓	✓
`qwen-max`	32k	8k	—	✓	—	✓	✓
`qwen-max-latest`	32k	8k	—	✓	—	✓	✓
`qwen-max-2025-01-25`	32k	8k	—	✓	—	✓	✓
`qwen-max-2024-09-19`	32k	8k	—	✓	—	✓	✓
`qwen-max-2024-04-28`	8k	2k	—	✓	—	✓	✓
`qwen-flash`	1M	32k	80k	✓	—	✓	✓
`qwen-flash-2025-07-28`	1M	32k	80k	✓	—	✓	✓
`qwen-turbo`	128k	16k	38k	✓	—	✓	✓
`qwen-turbo-latest`	128k	16k	38k	✓	—	✓	✓
`qwen-turbo-2025-04-28`	128k	16k	38k	✓	—	✓	✓
`qwen-turbo-2024-11-01`	1M	8k	—	✓	—	✓	✓
`qwen-turbo-2025-02-11`	1M	8k	—	✓	—	✓	✓
`qwen-turbo-2025-07-15`	128k	16k	38k	✓	—	✓	✓
`qwq-plus`	128k	8k	32k	—	—	—	✓
`qwq-plus-latest`	128k	8k	32k	—	—	—	—
`qwq-plus-2025-03-05`	128k	8k	32k	—	—	—	—
`qvq-max`	128k	8k	80k	—	—	—	—
`qvq-max-latest`	128k	8k	80k	—	—	—	—
`qvq-max-2025-03-25`	128k	8k	80k	—	—	—	—
`qwen-omni-turbo`	32k	2k	80k	—	—	—	—
`qwen-omni-turbo-latest`	32k	2k	80k	—	—	—	—
`qwen-omni-turbo-2025-03-26`	32k	2k	80k	—	—	—	—

三方模型

模型	上下文	思考模式	函数调用	内置工具	结构化输出	批量
`glm-5`	198k	✓	✓	—	✓	—
`glm-4.7`	198k	✓	✓	—	✓	—
`glm-4.6`	198k	✓	✓	—	✓	—
`glm-4.5`	198k	✓	✓	—	✓	—
`glm-4.5-air`	198k	✓	✓	—	✓	—
`MiniMax-M2.1`	200k	✓	✓	—	—	—
`kimi-k2.5`	256k	✓	✓	—	—	—
`kimi-k2-thinking`	256k	✓	✓	—	✓	—
`Moonshot-Kimi-K2-Instruct`	256k	—	✓	—	—	—
`deepseek-v3.2`	128k	✓	✓	—	—	✓
`deepseek-v3.2-exp`	128k	✓	✓	—	—	—
`deepseek-v3.1`	128k	✓	✓	—	—	—
`deepseek-v3`	128k	—	✓	—	—	✓
`deepseek-r1`	128k	✓	✓	—	—	✓
`deepseek-r1-0528`	128k	✓	✓	—	—	—
`deepseek-r1-distill-llama-70b`	128k	✓	—	—	—	—
`deepseek-r1-distill-qwen-32b`	128k	✓	—	—	—	—
`deepseek-r1-distill-qwen-14b`	128k	✓	—	—	—	—
`deepseek-r1-distill-qwen-7b`	128k	✓	—	—	—	—
`deepseek-r1-distill-qwen-1.5b`	128k	✓	—	—	—	—
`deepseek-r1-distill-llama-8b`	128k	✓	—	—	—	—

文本生成模型

做 AI 编程或 Agent 开发（OpenClaw、Claude Code、Hermes 等）该选哪个模型？

从闭源模型迁移到千问云？

其他应用场景

上下文窗口

思考模式

函数调用与内置工具

批量推理

推荐模型

全部模型

Qwen3

Qwen3-Coder

Qwen2.5（开源）

QwQ / QVQ（开源）

Qwen-Coder（旧版，qwen2.5之前）

Qwen2.5-Coder（开源）

翻译

千问Long（长上下文）

角色扮演

旧版Qwen

三方模型

了解更多

模型选择指南

免费试用

​做 AI 编程或 Agent 开发（OpenClaw、Claude Code、Hermes 等）该选哪个模型？

​从闭源模型迁移到千问云？

​其他应用场景

​上下文窗口

​思考模式

​函数调用与内置工具

​批量推理

​推荐模型

​全部模型

Qwen3

Qwen3-Coder

Qwen2.5（开源）

QwQ / QVQ（开源）

Qwen-Coder（旧版，qwen2.5之前）

Qwen2.5-Coder（开源）

翻译

千问Long（长上下文）

角色扮演

旧版Qwen

三方模型

​了解更多

模型选择指南

免费试用

做 AI 编程或 Agent 开发（OpenClaw、Claude Code、Hermes 等）该选哪个模型？

从闭源模型迁移到千问云？

其他应用场景

上下文窗口

思考模式

函数调用与内置工具

批量推理

推荐模型

全部模型

了解更多