鉴权
string
header
必填
千问云 API Key。详见获取 API Key。
请求体
application/jsonobject[]
必填
按对话顺序向模型提供上下文的消息序列。
boolean
默认值false
指定是否以流式模式返回响应。false:一次性返回完整响应。true:随模型生成过程逐块返回数据。
object
流式输出的配置项,仅在 stream 为 true 时生效。
integer
输出的最大 token 数。如果生成内容超过该值,响应将被截断。
- 对于 qwen-vl-ocr-latest、qwen-vl-ocr-2025-11-20 和 qwen-vl-ocr-2024-10-28,默认值和最大值与模型的最大输出长度相同。
- 对于 qwen-vl-ocr、qwen-vl-ocr-2025-04-13 和 qwen-vl-ocr-2025-08-28,默认值和最大值均为 4096。
boolean
默认值false
指定是否返回输出 token 的对数概率。
integer
默认值0
指定每个生成步骤中返回的最可能 token 数量。取值范围:[0, 5]。仅在 logprobs 为 true 时生效。
number
默认值0.01
采样温度,控制生成文本的多样性。值越高越多样,值越低越确定。取值范围:[0, 2)。temperature 和 top_p 只能设置其中之一。
number
默认值0.001
核采样的概率阈值。值越高越多样,值越低越确定。取值范围:(0, 1.0]。temperature 和 top_p 只能设置其中之一。
integer
默认值1
采样候选集大小。值越大随机性越高。若为 None 或大于 100,则仅 top_p 生效。必须 >= 0。非标准 OpenAI 参数,Python SDK 中请使用 extra_body={"top_k": xxx}。
number
默认值1
重复序列的惩罚系数。值越高越能减少重复。1.0 表示不惩罚。
number
默认值0
控制内容重复程度。取值范围:[-2.0, 2.0]。正值减少重复,负值增加重复。
integer
用于复现结果的随机数种子。取值范围:[0, 2^31−1]。
string
停止词。当出现指定字符串或 token_id 时,立即停止生成。可以是字符串或数组。stop 为数组时,不能混用 token_id 和字符串。

