qwen3-rerank
使用 qwen3-rerank 根据语义相关性对文档进行重排序。
支持的模型: 仅支持 qwen3-rerank。
参数说明:
调用 API 前,请先获取 API Key 并设置为环境变量。如果使用 OpenAI SDK,请先安装 SDK。
接入点
- HTTP:
POST https://dashscope.aliyuncs.com/compatible-api/v1/reranks - SDK
base_url:https://dashscope.aliyuncs.com/compatible-api/v1
模型概览
| 模型 | 最大文档数 | 单文档最大 Token 数 | 请求最大 Token 数 | 支持语言 | 价格(每百万 Token) | 免费额度 | 适用场景 |
|---|---|---|---|---|---|---|---|
| qwen3-rerank | 500 | 4,000 | 120,000 | 100+ 种语言 | 0.5元 | 100 万 Token(90 天有效) | 文本语义搜索、RAG |
- 单文档最大 Token 数:单条查询或文档允许的最大 Token 数量。超出此限制的内容将被截断,可能影响排序准确性。
- 最大文档数:单次请求允许的最大文档数量。
- 请求最大 Token 数:计算公式为
查询 Token 数 x 文档数量 + 所有文档 Token 总数,不得超过此限制。
鉴权
string
header
必填
千问云 API Key。详见获取 API Key。
请求体
application/jsonenum<string>
必填
模型名称。可选值:qwen3-rerank、qwen3-vl-rerank、gte-rerank-v2(将于 2026-05-30 下线,推荐使用 qwen3-rerank)。
qwen3-rerank,qwen3-vl-rerank,gte-rerank-v2
qwen3-rerank
string
必填
查询文本。最大 4,000 个 token。
What is a reranking model
string[]
必填
待排序的文档列表,字符串数组。最多 500 篇文档。
integer
仅返回得分最高的前 N 个结果。默认返回全部文档。
2
x >= 1
string
自定义排序任务指令,建议使用英文。默认行为为问答检索:"Given a web search query, retrieve relevant passages that answer the query."
Given a web search query, retrieve relevant passages that answer the query.

