自动化多步研究与网络搜索
面对复杂研究课题,传统的手动搜索耗时费力,而大模型结合联网搜索的功能也往往难以进行深度、系统的分析。深入研究模型(Qwen-Deep-Research)能自动规划研究步骤、执行多轮的深入搜索与信息整合,并最终生成一份结构化的研究报告。
您需要已获取API Key并配置API Key到环境变量。如果通过SDK调用,还需要安装DashScope SDK。
模型采用两步式工作流程:反问确认(明确研究范围)和深入研究(执行搜索并生成报告)。以下示例展示了包含两个步骤的完整调用流程。
模型通过
深入研究模型支持在用户消息中传入图片,模型能理解图片内容并结合图片进行深入研究分析。传入图片时,
计费方式:计费基于输入和输出Token总量。输入Token包含用户消息内容和模型内置的系统提示词。输出Token包含反问确认、研究计划、研究目标、搜索查询和最终研究报告等所有生成内容。
流式输出处理
模型仅支持流式输出(
关于Qwen-Deep-Research模型的输入与输出参数,请参考 API 参考文档。
如果模型调用失败并返回报错信息,请参见错误信息进行解决。
模型限流触发条件请参考:限流。
快速开始
您需要已获取API Key并配置API Key到环境变量。如果通过SDK调用,还需要安装DashScope SDK。
模型采用两步式工作流程:反问确认(明确研究范围)和深入研究(执行搜索并生成报告)。以下示例展示了包含两个步骤的完整调用流程。
模型目前仅可通过 DashScope SDK 调用,暂不支持 Java 版 DashScope SDK,也不支持 OpenAI 兼容接口调用。
模型列表
| 模型名称 | 上下文长度 (Token) | 最大输入 (Token) | 最大输出 (Token) |
|---|---|---|---|
| qwen-deep-research | 1,000,000 | 997,952 | 32,768 |
| qwen-deep-research-2025-12-15 | 1,000,000 | 997,952 | 32,768 |
qwen-deep-research为主线模型,持续更新优化。qwen-deep-research-2025-12-15为快照版本,在研究深度和报告质量上更优,且额外支持MCP 工具调用能力。两个模型均支持图片输入。两者独立计费。核心能力
模型通过 phase 和 status 字段展示工作流程。phase 表示当前执行的核心任务,status 表示该任务的内部进度。
反问确认与报告生成 (phase: "answer")
模型分析用户初始问题,提出细化问题确认研究范围。在生成最终报告时,此阶段复用。
状态变化:
typing: 正在生成文本内容finished: 文本内容生成完毕
typing: 正在生成研究计划finished: 研究计划制定完成
WebResultFinished状态,整个阶段结束后返回finished状态。
状态变化:
streamingThinking: 正在拆解研究任务并总结网页内容(qwen-deep-research-2025-12-15模型专用,替代streamingQueries和streamingWebResult)streamingQueries: 正在生成搜索查询词(仅qwen-deep-research模型)streamingWebResult: 正在执行网络搜索并分析网页内容(仅qwen-deep-research模型)WebResultFinished: 单轮搜索结束finished: 网络搜索阶段整体完成
图片输入
深入研究模型支持在用户消息中传入图片,模型能理解图片内容并结合图片进行深入研究分析。传入图片时,content字段需使用数组格式,包含image和text对象。
- 支持 JPEG、PNG、BMP、WEBP 等常见格式,单张图片不超过 10MB。
- 单次请求最多传入 5 张图片,支持公网 URL 和 Base64 编码两种传入方式。
- 响应格式与纯文本请求一致,模型会结合图片内容进行研究并返回报告。
MCP 工具调用
MCP 工具调用仅
qwen-deep-research-2025-12-15模型支持,主线模型qwen-deep-research不支持此功能。qwen-deep-research-2025-12-15模型支持通过research_tools参数接入 MCP(Model Context Protocol)服务,使模型在研究过程中能够调用外部工具进行信息检索。响应格式与标准调用一致,模型会在 WebResearch 阶段通过 MCP Server 调用指定工具。
research_tools的完整参数说明和 MCP 工具规范请参考 API 参考文档。请求示例
计费说明
| 模型名称 | 输入成本 (每千Token) | 输出成本 (每千Token) | 免费额度 |
|---|---|---|---|
| qwen-deep-research | 0.054元 | 0.163元 | 无免费额度 |
| qwen-deep-research-2025-12-15 | 0.079元 | 0.236元 | 无免费额度 |
应用于生产环境
流式输出处理
模型仅支持流式输出(stream=True)。处理响应时需正确解析 phase 和 status 字段,判断当前阶段和完成状态。
错误处理
检查响应状态码,非200状态需处理错误。流式响应早期阶段某些响应块可能只包含元数据,后续块会包含实际内容。
Token消耗监控
在 status 为 finished 时,通过 response.usage 获取Token消耗统计,包括输入Tokens、输出Tokens和请求ID。
连接管理
模型可能在长任务间隙发送 KeepAlive 阶段响应,用于维持连接。可忽略此阶段内容,继续处理后续响应。
常见问题
为什么某些响应块的output为空?
为什么某些响应块的output为空?
在流式响应的早期阶段,某些响应块可能只包含元数据信息,后续块会包含实际内容。
如何判断某个阶段是否完成?
如何判断某个阶段是否完成?
当
status 字段变为 "finished" 时,表示当前阶段完成。模型是否支持OpenAI兼容接口调用?
模型是否支持OpenAI兼容接口调用?
模型目前暂不支持通过OpenAI兼容接口调用。
模型的输入与输出Token数量是如何计算的?
模型的输入与输出Token数量是如何计算的?
输入Token包含用户发送的消息内容和模型内置的系统提示词,包括用户问题、用户回答和系统提示词。输出Token包含模型在整个研究过程中生成的所有内容,包括反问确认内容、研究计划、研究目标、搜索查询和最终研究报告。
qwen-deep-research 和 qwen-deep-research-2025-12-15 有什么区别?
qwen-deep-research 和 qwen-deep-research-2025-12-15 有什么区别?
qwen-deep-research是主线模型,持续更新。qwen-deep-research-2025-12-15是快照版本,效果更优,额外支持 MCP 工具调用能力。两个模型均支持图片输入。两者独立计费,快照版本的价格略高于主线版本。如何传入图片进行研究?
如何传入图片进行研究?
将
content字段设为数组格式,包含{"image": "图片URL"}和{"text": "文本描述"}。两个模型均支持图片输入。如何跳过反问确认,让模型直接进入研究?
如何跳过反问确认,让模型直接进入研究?
在
parameters中设置enable_feedback为false即可跳过反问确认阶段,模型将直接进入研究流程。
