抓取 URL 内容作为上下文
code_interpreter 和 Web extractor,以提升准确性。快速开始
通过 Responses API 调用 Web extractor 来摘要网页内容。以下示例使用 web_search 和 web_extractor,搭配 qwen3-max-2026-01-23 的思考模式。
- Python
- Node.js
- curl
响应结构
响应包含模型生成的文本及工具使用的元数据。
| 字段 | 说明 |
|---|---|
output_text | 模型基于提取的网页内容生成的最终文本响应 |
output[] | 中间结果数组,包含 web_extractor_call 对象(每个对象含 goal 和 output 字段,分别表示抓取的 URL 和提取的内容) |
usage.x_tools.web_extractor.count | 本次请求中 Web extractor 的调用次数 |
usage.x_tools.web_search.count | 本次请求中 Web search 的调用次数 |
工作原理
- 在 API 请求的
tools数组中添加web_extractor(通常同时添加web_search),并在 prompt 中引用 URL 或主题。 - 模型自动判断需要抓取的页面,获取页面内容,并将其作为额外的输入 token 追加到上下文中。
- 模型基于获取的内容生成响应。
使用场景
| 场景 | 工具配置 | 原因 |
|---|---|---|
| 回答关于特定 URL 的问题 | web_extractor(可选搭配 web_search) | 模型抓取并阅读完整页面内容,而非仅搜索摘要 |
| 主题研究,搜索多个网页 | web_search + web_extractor | web_search 查找相关页面;web_extractor 读取完整内容 |
| 快速事实查询(无特定 URL) | 仅 web_search | 搜索摘要通常足够,更经济高效 |
web_extractor。
调用方式
Web extractor 支持三种 API。Responses API 提供最精细的工具控制能力,建议新项目优先使用。
| API | 工具配置 | 是否必须流式 | 备注 |
|---|---|---|---|
| Responses API(推荐) | 在 tools 中添加 web_search 和 web_extractor | 否 | 支持中间工具执行状态 |
| Chat Completions API | 设置 enable_search: true,search_strategy: "agent_max" | 是 | 不支持非流式 |
| DashScope API | 设置 enable_search: true,search_strategy: "agent_max" | 是 | 不支持 Java SDK |
qwen3-max-2026-01-23 时,需将 enable_thinking 设为 true。- Responses API
- Chat Completions API
- DashScope API
函数调用的唯一标识符。仅当 type 为 function_call 时存在此字段。返回函数调用结果时,必须使用此 ID 关联请求与响应。
消息内容数组。仅当 type 为 message 时存在此字段。
文本注释数组。通常为空数组。