千问云在推理过程中如何处理您的数据
千问云不会使用您的 API 输入或输出来训练或改进模型。本页介绍推理过程中的数据处理方式。
通过 API 向千问云发送请求时:
启用上下文缓存后,缓存的 Prompt 数据及关联的 Key-Value 缓存保留在易失性内存中,持续时间与缓存 TTL 一致。缓存数据不会写入持久化存储,TTL 到期后自动清除。
Responses API 为多轮对话场景存储上下文:
默认数据处理
通过 API 向千问云发送请求时:
- 输入和输出仅在请求期间于内存中处理。响应返回后,数据不会写入持久化存储。
- 元数据(如 Token 用量、时间戳、请求 ID)会记录日志,用于计费、限流和服务运营。
- 不使用您的数据进行训练:您的 Prompt 和生成结果不会被用于训练、微调或改进 Qwen 模型。
Prompt 缓存
启用上下文缓存后,缓存的 Prompt 数据及关联的 Key-Value 缓存保留在易失性内存中,持续时间与缓存 TTL 一致。缓存数据不会写入持久化存储,TTL 到期后自动清除。
对话存储(Responses API)
Responses API 为多轮对话场景存储上下文:
- 上下文关联:使用
previous_response_id关联对话中的各轮次。响应 ID 在 7 天内有效,服务端会自动检索并组合之前的输入输出作为上下文。 - 自动过期:通过
previous_response_id关联的对话数据在 7 天后自动删除。
最佳实践
- 使用 Responses API 的
previous_response_id时,对话上下文会存储 7 天。如果应用涉及高度敏感数据,请避免关联多轮对话。 - 尽量避免在 Prompt 中包含个人身份信息(PII)。
- 在应用层实施数据最小化原则——仅发送模型所需的上下文。
了解更多
- 数据安全:加密、API Key 安全和内容审核。

