选择适用于 AI 智能体、聊天机器人、文档处理等场景的模型。
使用 OpenClaw、Claude Code 或 Hermes?
推荐 qwen3.6-plus——能力与成本均衡,完整工具调用支持,1M 上下文适合大型代码库。Token Plan 用户还可选择 glm-5.1 或 MiniMax-M2.5,均针对智能体工作流进行了优化。
从闭源模型迁移到千问云?
如果你正在使用 GPT、Claude 或 Gemini,可参考下表按能力档选择千问云对位模型。
| 闭源模型代表 | 千问云推荐 | |
|---|---|---|
| 高能力 | GPT-5.5、Claude Opus 4.7、Gemini 3.1 Pro | qwen3.6-max-preview |
| 平衡 | GPT-5.4、Claude Sonnet 4.6、Gemini 3 Pro | qwen3.6-plus、deepseek-v4-pro、glm-5.1 |
| 轻量低成本 | GPT-5.4-mini、Claude Haiku 4.5、Gemini 3.1 Flash | qwen3.6-flash、deepseek-v4-flash、MiniMax-M2.5 |
其他应用场景
聊天机器人、内容生成、摘要总结、文档处理——首选 qwen3.6-plus,能力与成本均衡,支持 1M 上下文和完整功能集。验证效果后,可尝试 qwen3.6-flash 降低成本——接近旗舰水平,上下文长度和功能一致。如需最强推理能力,可选择 qwen3.6-max-preview,但成本较高。
上下文窗口
1M token 约等于 75 万字或 10 本书。
- 长文档或大型代码库 →
qwen3.6-plus/qwen3.6-flash(1M) - 常规任务 → 128k–256k 足够
思考模式
适用于多步数学推导、代码调试、架构设计、法律条文交叉引用等需要逐步推理的场景。
通过 enable_thinking 开关控制。所有 Qwen3+ 模型均支持——大多数为混合模式,可按请求切换。
函数调用与内置工具
让模型执行操作:查天气、查数据库、预订会议。
- 函数调用(自定义工具,模型调用):所有通用模型均支持
- 内置工具(联网搜索、代码解释器、网页抓取等,无需复杂配置)
结构化输出
返回合法 JSON——例如从文本中提取姓名和日期。
支持模型:Qwen3.6、Qwen3.5、Qwen3、Qwen3-Coder、Qwen2.5 及旧版(Plus/Max/Flash/Turbo)——非思考模式下可用。
批量推理
适用于大量请求且对延迟要求不高的场景,可降低请求成本。
推荐模型
全部模型
Qwen3.6
Qwen3.6
Qwen3.5
Qwen3.5
| 模型 | 上下文 | 最大输出 | 思考预算 | 函数调用 | 内置工具 | 结构化输出 | 批量 | Token Plan | 显式缓存 | 隐式缓存 | 会话缓存 |
|---|---|---|---|---|---|---|---|---|---|---|---|
qwen3.5-plus | 1M | 64k | 80k | ✓ | ✓ | ✓ | ✓ | — | ✓ | — | ✓ |
qwen3.5-plus-2026-02-15 | 1M | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — | — |
qwen3.5-plus-2026-04-20 | 1M | 64k | 80k | ✓ | ✓ | ✓ | — | — | ✓ | — | — |
qwen3.5-flash | 1M | 64k | 80k | ✓ | ✓ | ✓ | ✓ | — | ✓ | — | ✓ |
qwen3.5-flash-2026-02-23 | 1M | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — | — |
qwen3.5-397b-a17b | 256k | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — | — |
qwen3.5-122b-a10b | 256k | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — | — |
qwen3.5-27b | 256k | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — | — |
qwen3.5-35b-a3b | 256k | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — | — |
第三方模型
第三方模型
通过同一 API 可用的非 Qwen 模型。
* DeepSeek-V4 的 384k(393,216 Token)限制由思考和最终输出共享。** MiniMax-M2.5 的 32k 限制由 CoT 和最终输出共享。
旧版及其他模型
旧版及其他模型
上一代模型。新项目建议使用 Qwen3.6。
Qwen3
| 模型 | 上下文 | 最大输出 | 思考预算 | 函数调用 | 内置工具 | 结构化输出 | 批量 | 显式缓存 | 隐式缓存 | 会话缓存 |
|---|---|---|---|---|---|---|---|---|---|---|
qwen3-max | 256k | 64k | 80k | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
qwen3-max-2026-01-23 | 256k | 64k | 80k | ✓ | ✓ | ✓ | — | — | — | — |
qwen3-max-preview | 256k | 64k | 80k | ✓ | ✓ | ✓ | — | — | ✓ | — |
qwen3-max-2025-09-23 | 256k | 64k | — | ✓ | ✓ | ✓ | — | — | — | — |
qwen3-235b-a22b | 128k | 16k | 38k | ✓ | — | ✓ | — | — | — | — |
qwen3-235b-a22b-thinking-2507 | 128k | 32k | 80k | ✓ | — | — | — | — | — | — |
qwen3-235b-a22b-instruct-2507 | 128k | 32k | — | ✓ | — | ✓ | — | — | — | — |
qwen3-next-80b-a3b-thinking | 128k | 32k | 80k | ✓ | — | — | — | — | — | — |
qwen3-next-80b-a3b-instruct | 128k | 32k | — | ✓ | — | ✓ | — | — | — | — |
qwen3-32b | 128k | 16k | 38k | ✓ | — | ✓ | — | — | — | — |
qwen3-30b-a3b | 128k | 16k | 38k | ✓ | — | ✓ | — | — | — | — |
qwen3-30b-a3b-thinking-2507 | 128k | 32k | 80k | ✓ | — | — | — | — | — | — |
qwen3-30b-a3b-instruct-2507 | 128k | 32k | — | ✓ | — | ✓ | — | — | — | — |
qwen3-14b | 128k | 8k | 38k | ✓ | — | ✓ | — | — | — | — |
qwen3-8b | 128k | 8k | 38k | ✓ | — | ✓ | — | — | — | — |
qwen3-4b | 128k | 8k | 38k | ✓ | — | ✓ | — | — | — | — |
qwen3-1.7b | 32k | 8k | 30k | ✓ | — | ✓ | — | — | — | — |
qwen3-0.6b | 32k | 8k | 30k | ✓ | — | ✓ | — | — | — | — |
Qwen3-Coder
| 模型 | 上下文 | 最大输出 | 函数调用 | 内置工具 | 结构化输出 | 批量 | 显式缓存 | 隐式缓存 | 会话缓存 |
|---|---|---|---|---|---|---|---|---|---|
qwen3-coder-plus | 1M | 64k | ✓ | — | ✓ | — | ✓ | ✓ | ✓ |
qwen3-coder-plus-2025-09-23 | 1M | 64k | ✓ | — | ✓ | — | — | — | — |
qwen3-coder-plus-2025-07-22 | 1M | 64k | ✓ | — | ✓ | — | — | — | — |
qwen3-coder-flash | 1M | 64k | ✓ | — | ✓ | — | ✓ | ✓ | ✓ |
qwen3-coder-flash-2025-07-28 | 1M | 64k | ✓ | — | ✓ | — | — | — | — |
qwen3-coder-next | 256k | 64k | ✓ | — | ✓ | — | — | — | — |
qwen3-coder-480b-a35b-instruct | 256k | 64k | ✓ | — | ✓ | — | — | — | — |
qwen3-coder-30b-a3b-instruct | 256k | 64k | ✓ | — | ✓ | — | — | — | — |
Qwen2.5(开源)
| 模型 | 上下文 | 最大输出 | 函数调用 | 内置工具 | 结构化输出 | 批量 | 显式缓存 | 隐式缓存 | 会话缓存 |
|---|---|---|---|---|---|---|---|---|---|
qwen2.5-omni-7b | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-72b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-72b-instruct-1m | 1M | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-32b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-14b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-7b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-3b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-1.5b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
qwen2.5-0.5b-instruct | 32k | 8k | ✓ | — | ✓ | — | — | — | — |
QwQ / QVQ(开源)
Qwen-Coder(旧版,qwen2.5之前)
Qwen2.5-Coder(开源)
翻译
| 模型 | 上下文 | 思考模式 | 函数调用 | 内置工具 | 结构化输出 | 批量 |
|---|---|---|---|---|---|---|
qwen-mt-plus | 16k | — | — | — | — | — |
qwen-mt-turbo | 16k | — | — | — | — | — |
qwen-mt-flash | 16k | — | — | — | — | — |
qwen-mt-lite | 16k | — | — | — | — | — |
千问Long(长上下文)
| 模型 | 上下文 | 思考模式 | 函数调用 | 内置工具 | 结构化输出 | 批量 |
|---|---|---|---|---|---|---|
qwen-long | 10M | — | — | — | ✓ | ✓ |
qwen-long-latest | 10M | — | — | — | ✓ | ✓ |
qwen-long-2025-01-25 | 10M | — | — | — | ✓ | — |
角色扮演
| 模型 | 上下文 | 思考模式 | 函数调用 | 内置工具 | 结构化输出 | 批量 |
|---|---|---|---|---|---|---|
qwen-plus-character | 32k | — | — | — | — | — |
qwen-plus-character-ja | 32k | — | — | — | — | — |
qwen-flash-character | 8k | — | — | — | — | — |
旧版Qwen
| 模型 | 上下文 | 最大输出 | 思考预算 | 函数调用 | 内置工具 | 结构化输出 | 批量 | 显式缓存 | 隐式缓存 | 会话缓存 |
|---|---|---|---|---|---|---|---|---|---|---|
qwen-plus | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | ✓ | ✓ | ✓ |
qwen-plus-latest | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-12-01 | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-09-11 | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-07-28 | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-07-14 | 128k | 16k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-04-28 | 128k | 16k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-01-25 | 128k | 8k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2025-01-12 | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-plus-2024-12-20 | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-max | 32k | 8k | — | ✓ | — | ✓ | ✓ | — | ✓ | — |
qwen-max-latest | 32k | 8k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-max-2025-01-25 | 32k | 8k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-max-2024-09-19 | 32k | 8k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-max-2024-04-28 | 8k | 2k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-flash | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | ✓ | ✓ | ✓ |
qwen-flash-2025-07-28 | 1M | 32k | 80k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-turbo | 128k | 16k | 38k | ✓ | — | ✓ | ✓ | — | ✓ | — |
qwen-turbo-latest | 128k | 16k | 38k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-turbo-2025-04-28 | 128k | 16k | 38k | ✓ | — | ✓ | ✓ | — | — | — |
qwen-turbo-2024-11-01 | 1M | 8k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-turbo-2025-02-11 | 1M | 8k | — | ✓ | — | ✓ | ✓ | — | — | — |
qwen-turbo-2025-07-15 | 128k | 16k | 38k | ✓ | — | ✓ | ✓ | — | — | — |
qwq-plus | 128k | 8k | 32k | — | — | — | ✓ | — | — | — |
qwq-plus-latest | 128k | 8k | 32k | — | — | — | — | — | — | — |
qwq-plus-2025-03-05 | 128k | 8k | 32k | — | — | — | — | — | — | — |
qvq-max | 128k | 8k | 80k | — | — | — | — | — | — | — |
qvq-max-latest | 128k | 8k | 80k | — | — | — | — | — | — | — |
qvq-max-2025-03-25 | 128k | 8k | 80k | — | — | — | — | — | — | — |
qwen-omni-turbo | 32k | 2k | 80k | — | — | — | — | — | — | — |
qwen-omni-turbo-latest | 32k | 2k | 80k | — | — | — | — | — | — | — |
qwen-omni-turbo-2025-03-26 | 32k | 2k | 80k | — | — | — | — | — | — | — |
三方模型
| 模型 | 上下文 | 思考模式 | 函数调用 | 内置工具 | 结构化输出 | 批量 | 显式缓存 | 隐式缓存 | 会话缓存 |
|---|---|---|---|---|---|---|---|---|---|
glm-5 | 198k | ✓ | ✓ | — | ✓ | — | — | ✓ | — |
glm-4.7 | 198k | ✓ | ✓ | — | ✓ | — | — | ✓ | — |
glm-4.6 | 198k | ✓ | ✓ | — | ✓ | — | — | ✓ | — |
glm-4.5 | 198k | ✓ | ✓ | — | ✓ | — | — | — | — |
glm-4.5-air | 198k | ✓ | ✓ | — | ✓ | — | — | — | — |
MiniMax-M2.1 | 200k | ✓ | ✓ | — | — | — | — | ✓ | — |
kimi-k2.5 | 256k | ✓ | ✓ | — | — | — | ✓ | ✓ | — |
kimi-k2-thinking | 256k | ✓ | ✓ | — | ✓ | — | — | ✓ | — |
Moonshot-Kimi-K2-Instruct | 256k | — | ✓ | — | — | — | — | ✓ | — |
deepseek-v3.2 | 128k | ✓ | ✓ | — | — | ✓ | ✓ | ✓ | — |
deepseek-v3.2-exp | 128k | ✓ | ✓ | — | — | — | — | — | — |
deepseek-v3.1 | 128k | ✓ | ✓ | — | — | — | — | ✓ | — |
deepseek-v3 | 128k | — | ✓ | — | — | ✓ | — | ✓ | — |
deepseek-r1 | 128k | ✓ | ✓ | — | — | ✓ | — | ✓ | — |
deepseek-r1-0528 | 128k | ✓ | ✓ | — | — | — | — | — | — |
deepseek-r1-distill-llama-70b | 128k | ✓ | — | — | — | — | — | — | — |
deepseek-r1-distill-qwen-32b | 128k | ✓ | — | — | — | — | — | — | — |
deepseek-r1-distill-qwen-14b | 128k | ✓ | — | — | — | — | — | — | — |
deepseek-r1-distill-qwen-7b | 128k | ✓ | — | — | — | — | — | — | — |
deepseek-r1-distill-qwen-1.5b | 128k | ✓ | — | — | — | — | — | — | — |
deepseek-r1-distill-llama-8b | 128k | ✓ | — | — | — | — | — | — | — |

