使用 qwen3-rerank 模型根据语义相关性对文档进行重排序。采用嵌套请求结构,通过
关于模型计费,请参见模型市场。
参数说明:
input 和 parameters 组织请求参数。
开始之前:获取 API Key、将其设置为环境变量,如果使用 SDK,还需安装 DashScope SDK。
接入点
- HTTP:
POST https://dashscope.aliyuncs.com/api/v1/services/rerank/text-rerank/text-rerank - SDK
base_http_api_url:https://dashscope.aliyuncs.com/api/v1
模型概览
| 模型 | 最大文档数 | 单文档最大 Token 数 | 请求最大 Token 数 | 支持语言 | 适用场景 |
|---|---|---|---|---|---|
| qwen3-rerank | 500 | 4,000 | 120,000 | 100+ 种语言 | 文本语义搜索、RAG |
- 单文档最大 Token 数:单条查询或文档允许的最大 Token 数量。超出此限制的内容将被截断,可能影响排序准确性。
- 最大文档数:单次请求允许的最大文档数量。
- 请求最大 Token 数:计算公式为
查询 Token 数 x 文档数量 + 所有文档 Token 总数,不得超过此限制。
鉴权
string
header
必填
千问云 API Key。详见获取 API Key。