OpenAI 兼容重排序 - 千问云
跳转到主要内容
重排序

OpenAI 兼容重排序

OpenAI 兼容的重排序 API

POST
/reranks
qwen3-rerank
curl --request POST \
  --url https://dashscope.aliyuncs.com/compatible-api/v1/reranks \
  --header "Authorization: Bearer $DASHSCOPE_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
        "model": "qwen3-rerank",
        "documents": [
                "Rerank models are widely used in search engines and recommendation systems. They sort candidate documents based on text relevance.",
                "Quantum computing is a cutting-edge field of computer science.",
                "The development of pre-trained language models has brought new advancements to rerank models."
        ],
        "query": "What is a rerank model?",
        "top_n": 2,
        "instruct": "Given a web search query, retrieve relevant passages that answer the query."
}'
{
  "id": "<string>",
  "object": "list",
  "model": "qwen3-rerank",
  "results": [
    {
      "document": {
        "text": "<string>"
      },
      "index": 0,
      "relevance_score": 0.9334521178273196
    }
  ],
  "usage": {
    "total_tokens": 0
  }
}
使用 qwen3-rerank 根据语义相关性对文档进行重排序。
调用 API 前,请先获取 API Key设置为环境变量。如果使用 OpenAI SDK,请先安装 SDK
支持的模型: 仅支持 qwen3-rerank。

接入点

  • HTTP:POST https://dashscope.aliyuncs.com/compatible-api/v1/reranks
  • SDK base_urlhttps://dashscope.aliyuncs.com/compatible-api/v1

模型概览

模型最大文档数单文档最大 Token 数请求最大 Token 数支持语言价格(每百万 Token)免费额度适用场景
qwen3-rerank5004,000120,000100+ 种语言0.5元100 万 Token(90 天有效)文本语义搜索、RAG
参数说明
  • 单文档最大 Token 数:单条查询或文档允许的最大 Token 数量。超出此限制的内容将被截断,可能影响排序准确性。
  • 最大文档数:单次请求允许的最大文档数量。
  • 请求最大 Token 数:计算公式为 查询 Token 数 x 文档数量 + 所有文档 Token 总数,不得超过此限制。

鉴权

string
header
必填

千问云 API Key。详见获取 API Key

请求体

application/json
enum<string>
必填

模型名称。可选值:qwen3-rerankqwen3-vl-rerankgte-rerank-v2(将于 2026-05-30 下线,推荐使用 qwen3-rerank)。

qwen3-rerank,qwen3-vl-rerank,gte-rerank-v2
qwen3-rerank
string
必填

查询文本。最大 4,000 个 token。

What is a reranking model
string[]
必填

待排序的文档列表,字符串数组。最多 500 篇文档。

[
  "Reranking models are widely used in search engines and recommendation systems to sort candidates by relevance",
  "Quantum computing is a frontier field of computer science",
  "The development of pre-trained language models has brought new advances to reranking"
]
integer

仅返回得分最高的前 N 个结果。默认返回全部文档。

2
x >= 1
string

自定义排序任务指令,建议使用英文。默认行为为问答检索:"Given a web search query, retrieve relevant passages that answer the query."

Given a web search query, retrieve relevant passages that answer the query.

响应

200-application/json
string

请求的唯一标识符。

string

对象类型。固定值为 list

list
string

本次重排序使用的模型。

qwen3-rerank
object[]

排序结果,按 relevance_score 从高到低排列。

object

Token 用量统计。