跳转到主要内容
向量与重排序

向量与重排模型

选择适用于语义搜索、RAG 检索、跨模态匹配和重排序的模型。

文本 Embedding

纯文本搜索、RAG 或聚类 → text-embedding-v4。 从 v3 索引迁移 → text-embedding-v3(维度兼容)。

维度如何选择?

大规模搜索且存储敏感 → 256 或 512。 通用场景 → 1024(默认,平衡性好)。 追求最高基准精度 → 1536 或 2048。

多模态 Embedding

通过文本检索图片或视频 → qwen3-vl-embedding

融合向量 vs 独立向量

  • 融合向量 — 将多模态输入(文本+图片+视频)编码为 1 个向量。适合图文混合检索。
  • 独立向量 — 每种输入分别生成独立向量。适合跨模态检索(文本查图、文本查视频)。
qwen3-vl-embedding 同时支持融合和独立向量;qwen2.5-vl-embedding 仅支持融合向量。

只有文本数据?

直接用 text-embedding-v4——更快、更便宜、维度选择更多。 多模态 Embedding 专为跨模态检索设计(文本+图片、文本+视频)。

重排序

提升 RAG 精度 → 在 Embedding 检索之后接入 qwen3-rerank,通过交叉注意力机制对 Top-N 结果重新打分,改善排序质量。 多模态重排序 → qwen3-vl-rerank,支持图片和视频输入。

全部模型

模型适用场景维度最大 Token 数
text-embedding-v4文本搜索、RAG、聚类64, 128, 256, 512, 768, 1024(默认), 1536, 20488,192
text-embedding-v3v3 索引迁移512, 768, 1024(默认)8,192
模型适用场景向量类型维度最大 Token 数
qwen3-vl-embedding图文混合检索融合 + 独立256~2560(默认 2560)32,000
qwen2.5-vl-embedding图文混合检索仅融合512~2048(默认 1024)32,000
tongyi-embedding-vision-plus跨模态搜索(仅独立向量)仅独立64~1152(默认 1152)1,024
tongyi-embedding-vision-plus-2026-03-06跨模态搜索融合 + 独立64~1152(默认 1152)1,024
tongyi-embedding-vision-flash跨模态搜索,注重成本(仅独立)仅独立64~768(默认 768)1,024
tongyi-embedding-vision-flash-2026-03-06跨模态搜索,注重成本融合 + 独立64~768(默认 768)1,024
模型适用场景最大文档数单条最大 Token
qwen3-vl-rerank多模态搜索结果重排序1008,000
qwen3-rerank文本搜索结果重排序、RAG5004,000
gte-rerank-v2文本语义检索、RAG5004,000
上一代模型。新项目建议使用上述最新版本。
模型类型维度最大 Token 数
text-embedding-v2文本 Embedding1,5362,048
text-embedding-v1文本 Embedding1,5362,048
text-embedding-async-v2文本 Embedding(异步)1,5362,048
text-embedding-async-v1文本 Embedding(异步)1,5362,048
multimodal-embedding-v1多模态 Embedding1,024--

了解更多