跳转到主要内容
文本向量

DashScope 文本向量

DashScope embedding API

POST
/api/v1/services/embeddings/text-embedding/text-embedding
import dashscope
from http import HTTPStatus

dashscope.base_http_api_url = 'https://dashscope.aliyuncs.com/api/v1'

resp = dashscope.TextEmbedding.call(
  model=dashscope.TextEmbedding.Models.text_embedding_v4,
  input='Semantic search finds documents by meaning rather than exact keyword matching. Text embeddings map words and sentences into high-dimensional vector spaces. Retrieval-augmented generation combines search results with language models. Document clustering groups similar texts based on their vector representations.',
  dimension=1024,
  output_type="dense&sparse"
)

print(resp) if resp.status_code == HTTPStatus.OK else print(resp)
{
  "status_code": 200,
  "request_id": "1ba94ac8-e058-99bc-9cc1-7fdb37940a46",
  "code": "",
  "message": "",
  "output": {
    "embeddings": [
      {
        "sparse_embedding": [
          {
            "index": 7149,
            "value": 0.829,
            "token": "wind"
          },
          {
            "index": 111290,
            "value": 0.9004,
            "token": "sorrow"
          }
        ],
        "embedding": [
          -0.006929283495992422,
          -0.005336422007530928
        ],
        "text_index": 0
      }
    ]
  },
  "usage": {
    "total_tokens": 27
  }
}
将文本转换为向量,用于语义搜索、推荐、聚类和分类。
开始之前:获取 API Key将其设置为环境变量,如果使用 SDK,还需安装 DashScope SDK

设置 SDK 基础 URL

Python SDK
import dashscope
dashscope.base_http_api_url = 'https://dashscope.aliyuncs.com/api/v1'
Java SDK
import com.alibaba.dashscope.utils.Constants;
Constants.baseHttpApiUrl = "https://dashscope.aliyuncs.com/api/v1";

支持的模型

模型向量维度最大 Token 数批量大小语言支持价格(每百万 Token)免费额度
text-embedding-v42048、1536、1024(默认)、768、512、256、128、648,19210100+ 种0.5元100 万 Token(90 天)
text-embedding-v31024(默认)、768、5128,1921050+ 种0.5元100 万 Token(90 天)

输入格式

  • 单个字符串:最多 8,192 个 Token
  • 数组:最多 10 个字符串,每个最多 8,192 个 Token
  • 文本文件:最多 10 行,每行最多 8,192 个 Token

DashScope 特有功能

  • text_type:设置为 querydocument,适用于检索等非对称任务。
  • output_type:返回稀疏向量(dense&sparse),用于混合搜索(仅 v3/v4 支持)。
  • instruct:添加任务描述以提升准确率约 1-5%(仅 v4 支持;建议使用英文)。
参见限流

鉴权

string
header
必填

千问云 API Key。详见获取 API Key

请求体

application/json
string
必填

调用的模型名称,支持 text-embedding-v4text-embedding-v3

text-embedding-v4
object
必填

包含待向量化文本的输入对象。

object

向量化请求的可选参数。

响应

200-application/json
integer
默认值"200"

状态码,200 表示请求成功。

string
默认值"1ba94ac8-e058-99bc-9cc1-7fdb37940a46"

请求的唯一标识符,可用于追踪和排查问题。

string
默认值""

请求失败时的错误码,成功时为空。

string
默认值""

请求失败时的详细错误信息,成功时为空。

object

任务输出数据。

object
默认值"{\"total_tokens\":27}"

Token 用量统计。