通过 Responses API 搜索图片
Responses API 提供两种内置图片搜索工具:以文搜图根据文字描述查找匹配的图片,以图搜图根据输入图片查找视觉上相似的图片。两种工具均返回 JSON 格式的结果数组和模型生成的分析。
这两种工具仅支持通过 Responses API 调用。
在互联网上搜索与文字描述匹配的图片,并由模型对搜索结果进行描述和分析。在
输出示例:
响应的
以文搜图涉及两项费用:
根据输入图片在互联网上查找视觉上相似的图片,并由模型分析搜索结果。在
将示例代码中的
输出示例:
响应的
以图搜图涉及两项费用:
两种图片搜索工具支持相同的模型。
图片搜索可能需要几秒钟。通过设置
请参阅图片限制了解支持的格式和大小限制,以及文件输入方式了解图片传入方法。
所有图片和文本的 Token 总数不能超过模型的最大输入长度。模型每次搜索一张图片,但可在单次响应中多次调用该工具来处理多张图片。
每次搜索返回的结果数量由模型决定,数量不固定,最多返回 100 张图片。
以文搜图
在互联网上搜索与文字描述匹配的图片,并由模型对搜索结果进行描述和分析。在 tools 参数中传入 {"type": "web_search_image"},模型会根据输入内容自动判断是否触发搜索。
示例
响应格式
响应的 output 数组包含两种类型的元素:
| 类型 | 说明 |
|---|---|
web_search_image_call | 原始搜索结果,为 JSON 数组。每个对象包含 index、title 和 url 字段。 |
message | 模型基于搜索结果生成的分析和推荐。 |
计费
以文搜图涉及两项费用:
| 费用类型 | 说明 |
|---|---|
| 模型调用费 | 图片搜索结果会添加到提示中,增加输入 Token 数量,按模型标准费率计费。详见计费说明。 |
| 工具调用费 | 每 1,000 次调用 24 元。 |
以图搜图
根据输入图片在互联网上查找视觉上相似的图片,并由模型分析搜索结果。在 tools 参数中传入 {"type": "image_search"},通过 input_image 内容类型提供图片。可选传入 input_text 消息,提供额外的搜索上下文。
示例
将示例代码中的 image_url 替换为可公开访问的图片 URL(OpenAI SDK 不支持本地文件路径)。
响应格式
响应的 output 数组包含两种类型的元素:
| 类型 | 说明 |
|---|---|
image_search_call | 工具调用结果,包含匹配图片的 JSON 数组。每个对象包含 index、title 和 url 字段。 |
message | 模型对搜索结果的分析,可通过 response.output_text 获取。 |
计费
以图搜图涉及两项费用:
| 费用类型 | 说明 |
|---|---|
| 模型输入 Token | 搜索结果会追加到提示中,增加输入 Token 数量,按模型标准费率计费。详见计费说明。 |
| 工具调用费 | 每 1,000 次调用 48 元。 |
支持的模型
两种图片搜索工具支持相同的模型。
| 模型系列 | 模型 ID |
|---|---|
| Qwen-Plus | qwen3.6-plus、qwen3.5-plus、qwen3.5-plus-2026-02-15 |
| Qwen-Flash | qwen3.5-flash、qwen3.5-flash-2026-02-23 |
| 开源 Qwen | qwen3.5-397b-a17b、qwen3.5-122b-a10b、qwen3.5-27b、qwen3.5-35b-a3b |
流式输出
流式输出的通用概念(SSE 协议、开启方式、计费和 Token 用量)请参阅流式输出。本节仅介绍图片搜索特有的流式行为。
stream=True(Python)或 stream: true(Node.js/curl)开启流式输出,可增量接收结果。响应按以下顺序发送事件:
| 事件类型 | 触发时机 | 处理方式 |
|---|---|---|
response.output_item.added | 工具调用开始 | 显示加载指示器。 |
response.output_item.done | 工具调用完成 | 将 event.item.output 解析为 JSON,获取图片列表。 |
response.content_part.added | 模型开始回复 | 准备渲染流式文本。 |
response.output_text.delta | 模型发送文本片段 | 将 event.delta 追加到输出。 |
response.completed | 完整响应就绪 | 读取最终 usage 统计信息。 |
常见问题
支持哪些图片格式和输入方式?
请参阅图片限制了解支持的格式和大小限制,以及文件输入方式了解图片传入方法。
OpenAI SDK 不支持本地文件路径输入。
可以传入多少张图片?
所有图片和文本的 Token 总数不能超过模型的最大输入长度。模型每次搜索一张图片,但可在单次响应中多次调用该工具来处理多张图片。
搜索的图片数量由模型自行决定。

