OpenAI 兼容重排序

POST

/reranks

qwen3-rerank

curl --request POST \
  --url https://dashscope.aliyuncs.com/compatible-api/v1/reranks \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
        "model": "qwen3-rerank",
        "documents": [
                "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
                "Quantum computing is a cutting-edge field of computer science.",
                "The development of pre-trained language models has brought new advancements to rerank models."
        ],
        "query": "What is a rerank model?",
        "top_n": 2,
        "instruct": "Given a web search query, retrieve relevant passages that answer the query."
}'

{
  "id": "<string>",
  "object": "list",
  "model": "qwen3-rerank",
  "results": [
    {
      "document": {
        "text": "<string>"
      },
      "index": 0,
      "relevance_score": 0.9334521178273196
    }
  ],
  "usage": {
    "total_tokens": 0
  }
}

使用 qwen3-rerank 根据语义相关性对文档进行重排序。

调用 API 前，请先获取 API Key 并设置为环境变量。如果使用 OpenAI SDK，请先安装 SDK。

支持的模型：仅支持 qwen3-rerank。

接入点

HTTP：POST https://dashscope.aliyuncs.com/compatible-api/v1/reranks
SDK base_url：https://dashscope.aliyuncs.com/compatible-api/v1

模型概览

模型	最大文档数	单文档最大 Token 数	请求最大 Token 数	支持语言	适用场景
qwen3-rerank	500	4,000	120,000	100+ 种语言	文本语义搜索、RAG

关于模型计费，请参见模型市场。 参数说明：

单文档最大 Token 数：单条查询或文档允许的最大 Token 数量。超出此限制的内容将被截断，可能影响排序准确性。
最大文档数：单次请求允许的最大文档数量。
请求最大 Token 数：计算公式为 查询 Token 数 x 文档数量 + 所有文档 Token 总数，不得超过此限制。

鉴权

string

header

必填

千问云 API Key。详见获取 API Key。

请求体

application/json

enum<string>

必填

模型名称。可选值：qwen3-rerank、qwen3-vl-rerank、gte-rerank-v2（将于 2026-05-30 下线，推荐使用 qwen3-rerank）。

可选值：qwen3-rerank,qwen3-vl-rerank,gte-rerank-v2

示例:qwen3-rerank

string

必填

查询文本。最大 4,000 个 token。

示例:What is a reranking model

string[]

必填

待排序的文档列表，字符串数组。最多 500 篇文档。

示例:

[
  "Reranking models are widely used in search engines and recommendation systems to sort candidates by relevance",
  "Quantum computing is a frontier field of computer science",
  "The development of pre-trained language models has brought new advances to reranking"
]

integer

仅返回得分最高的前 N 个结果。默认返回全部文档。

示例:2

取值范围：x >= 1

string

自定义排序任务指令，建议使用英文。默认行为为问答检索："Given a web search query, retrieve relevant passages that answer the query."

示例:Given a web search query, retrieve relevant passages that answer the query.

响应

200-application/json

string

请求的唯一标识符。

string

对象类型。固定值为 list。

示例:list

string

本次重排序使用的模型。

示例:qwen3-rerank

object[]

排序结果，按 relevance_score 从高到低排列。

显示子属性

object

原始文档内容。仅当 return_documents 为 true 时返回。

显示子属性

string

文档的文本内容。

integer

该文档在输入 documents 列表中的原始位置索引。

示例:0

number

相关度评分，范围 0.0 到 1.0，分值越高表示相关性越强。该分值为本次请求的相对分数，不可跨请求比较。

示例:0.9334521178273196

object

Token 用量统计。

显示子属性

integer

本次请求消耗的 token 总数。

​接入点

​模型概览

鉴权

请求体

响应

接入点

模型概览