DeepSeek-千问 AI 平台 - 千问 AI 平台

deepseek-v3、deepseek-v3.1、deepseek-v3.2、deepseek-v3.2-exp、deepseek-r1、deepseek-r1-0528、deepseek-r1-distill-qwen-7b/14b/32b 将于2026年10月10日下架。推荐转用：qwen3.7-plus、qwen3.7-max、qwen3.7-flash。

快速开始

deepseek-v4-pro 是 DeepSeek 系列最新模型，在编程、数学和通用任务方面表现出色。您可以通过enable_thinking参数在思考与非思考模式之间切换。以下示例展示如何调用思考模式的 deepseek-v4-pro 模型。需要已获取API Key并完成配置API Key到环境变量。如果通过SDK调用，需要安装 OpenAI 或 DashScope SDK。

OpenAI兼容
DashScope

enable_thinking非 OpenAI 标准参数，OpenAI Python SDK通过 extra_body传入，Node.js SDK作为顶层参数传入。reasoning_effort是 OpenAI 标准参数，可直接作为顶层参数传入。

Python
Node.js
curl

示例代码

from openai import OpenAI
import os

# 初始化OpenAI客户端
client = OpenAI(
  # 如果没有配置环境变量，请用千问 AI 平台API Key替换：api_key="sk-xxx"
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "你是谁"}]
completion = client.chat.completions.create(
  model="deepseek-v4-pro",
  messages=messages,
  # 通过 extra_body 设置 enable_thinking 开启思考模式
  extra_body={"enable_thinking": True},
  stream=True,
  stream_options={
    "include_usage": True
  },
)

reasoning_content = ""  # 完整思考过程
answer_content = ""  # 完整回复
is_answering = False  # 是否进入回复阶段
print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")

for chunk in completion:
  if not chunk.choices:
    print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
    print(chunk.usage)
    print("Request ID:", chunk.id)
    continue

  delta = chunk.choices[0].delta

  # 只收集思考内容
  if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
    if not is_answering:
      print(delta.reasoning_content, end="", flush=True)
    reasoning_content += delta.reasoning_content

  # 收到content，开始进行回复
  if hasattr(delta, "content") and delta.content:
    if not is_answering:
      print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
      is_answering = True
    print(delta.content, end="", flush=True)
    answer_content += delta.content

返回结果

====================思考过程====================

嗯，用户问了一个非常简单的自我介绍问题："你是谁"。

我需要明确自己的身份，用简洁友好的方式介绍我是DeepSeek，说明我的创造者、基本特性和可提供的帮助。

想到了可以这样组织回答：先直接表明身份，说明由深度求索公司创造，然后列出一些关键特点（免费、长上下文、文件上传等），最后以友好的邀请结束，询问是否需要帮助。
====================完整回复====================

你好！我是 DeepSeek，由深度求索公司创造的 AI 助手。

我可以帮你解答各种问题、进行文字创作、分析文档、编程辅助等等。我最大的特点是**免费使用**、**超长上下文**（能一次处理整本三体三部曲那么多内容）、支持**文件上传**和**联网搜索**（需手动开启）。

有什么我可以帮你的吗？不管是学习、工作还是日常闲聊，我都很乐意陪你聊聊！
====================Token 消耗====================

CompletionUsage(completion_tokens=238, prompt_tokens=5, total_tokens=243, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=93, rejected_prediction_tokens=None), prompt_tokens_details=None)
Request ID: chatcmpl-a1b2c3d4-e5f6-7890-abcd-ef1234567890

示例代码

import OpenAI from "openai";
import process from 'process';

// 初始化OpenAI客户端
const openai = new OpenAI({
  // 如果没有配置环境变量，请用千问 AI 平台API Key替换：apiKey: "sk-xxx"
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: 'https://dashscope.aliyuncs.com/compatible-mode/v1'
});

let reasoningContent = ''; // 完整思考过程
let answerContent = ''; // 完整回复
let isAnswering = false; // 是否进入回复阶段

async function main() {
  try {
    const messages = [{ role: 'user', content: '你是谁' }];

    const stream = await openai.chat.completions.create({
      model: 'deepseek-v4-pro',
      messages,
      // 注意：在 Node.js SDK，enable_thinking 这样的非标准参数作为顶层属性传递，无需放在 extra_body 中
      enable_thinking: true,
      stream: true,
      stream_options: {
        include_usage: true
      },
    });

    console.log('\n' + '='.repeat(20) + '思考过程' + '='.repeat(20) + '\n');

    for await (const chunk of stream) {
      if (!chunk.choices?.length) {
        console.log('\n' + '='.repeat(20) + 'Token 消耗' + '='.repeat(20) + '\n');
        console.log(chunk.usage);
        console.log('Request ID:', chunk.id);
        continue;
      }

      const delta = chunk.choices[0].delta;

      // 只收集思考内容
      if (delta.reasoning_content !== undefined && delta.reasoning_content !== null) {
        if (!isAnswering) {
          process.stdout.write(delta.reasoning_content);
        }
        reasoningContent += delta.reasoning_content;
      }

      // 收���content，开始进行回复
      if (delta.content !== undefined && delta.content) {
        if (!isAnswering) {
          console.log('\n' + '='.repeat(20) + '完整回复' + '='.repeat(20) + '\n');
          isAnswering = true;
        }
        process.stdout.write(delta.content);
        answerContent += delta.content;
      }
    }
  } catch (error) {
    console.error('Error:', error);
  }
}

main();

返回结果

====================思考过程====================

嗯，用户问了一个非常简单的自我介绍问题："你是谁"。

我需要明确自己的身份，用简洁友好的方式介绍我是DeepSeek，说明我的创造者、基本特性和可提供的帮助。

想到了可以这样组织回答：先直接表明身份，说明由深度求索公司创造，然后列出一些关键特点（免费、长上下文、文件上传等），最后以友好的邀请结束，询问是否需要帮助。
====================完整回复====================

你好！我是 DeepSeek，由深度求索公司创造的 AI 助手。

我可以帮你解答各种问题、进行文字创作、分析文档、编程辅助等等。我最大的特点是**免费使用**、**超长上下文**（能一次处理整本三体三部曲那么多内容）、支持**文件上传**和**联网搜索**（需手动开启）。

有什么我可以帮你的吗？不管是学习、工作还是日常闲聊，我都很乐意陪你聊聊！
====================Token 消耗====================

{
  prompt_tokens: 5,
  completion_tokens: 243,
  total_tokens: 248,
  completion_tokens_details: { reasoning_tokens: 83 }
}
Request ID: chatcmpl-a1b2c3d4-e5f6-7890-abcd-ef1234567890

示例代码

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "deepseek-v4-pro",
    "messages": [
        {
            "role": "user",
            "content": "你是谁"
        }
    ],
    "stream": true,
    "stream_options": {
        "include_usage": true
    },
    "enable_thinking": true
}'

Python
Java
curl

示例代码

import os
from dashscope import Generation

# 初始化请求参数
messages = [{"role": "user", "content": "你是谁？"}]

completion = Generation.call(
  # 如果没有配置环境变量，请用千问 AI 平台API Key替换：api_key="sk-xxx"
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  model="deepseek-v4-pro",
  messages=messages,
  result_format="message",  # 设置结果格式为 message
  enable_thinking=True,
  stream=True,              # 开启流式输出
  incremental_output=True,  # 开启增量输出
)

reasoning_content = ""  # 完整思考过程
answer_content = ""     # 完整回复
is_answering = False    # 是否进入回复阶段

print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")

for chunk in completion:
  message = chunk.output.choices[0].message
  # 只收集思考内容
  if "reasoning_content" in message:
    if not is_answering:
      print(message.reasoning_content, end="", flush=True)
    reasoning_content += message.reasoning_content

  # 收到 content，开始进行回复
  if message.content:
    if not is_answering:
      print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
      is_answering = True
    print(message.content, end="", flush=True)
    answer_content += message.content

print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
print(chunk.usage)
print("Request ID:", chunk.request_id)

返回结果

====================思考过程====================

嗯，用户问了一个非常简单的自我介绍问题："你是谁"。

我需要明确自己的身份，用简洁友好的方式介绍我是DeepSeek，说明我的创造者、基本特性和可提供的帮助。

想到了可以这样组织回答：先直接表明身份，说明由深度求索公司创造，然后列出一些关键特点（免费、长上下文、文件上传等），最后以友好的邀请结束，询问是否需要帮助。
====================完整回复====================

你好！我是 DeepSeek，由深度求索公司创造的 AI 助手。

我可以帮你解答各种问题、进行文字创作、分析文档、编程辅助等等。我最大的特点是**免费使用**、**超长上下文**（能一次处理整本三体三部曲那么多内容）、支持**文件上传**和**联网搜索**（需手动开启）。

有什么我可以帮你的吗？不管是学习、工作还是日常闲聊，我都很乐意陪你聊聊！
====================Token 消耗====================

{"input_tokens": 6, "output_tokens": 240, "total_tokens": 246, "output_tokens_details": {"reasoning_tokens": 92}}
Request ID: 85735883-9062-9c33-a963-0bc12584ee68

示例代码

DashScope Java SDK版本需要不低于2.19.4。

// dashscope SDK的版本 >= 2.19.4
import com.alibaba.dashscope.aigc.generation.Generation;
import com.alibaba.dashscope.aigc.generation.GenerationParam;
import com.alibaba.dashscope.aigc.generation.GenerationResult;
import com.alibaba.dashscope.common.Message;
import com.alibaba.dashscope.common.Role;
import com.alibaba.dashscope.exception.ApiException;
import com.alibaba.dashscope.exception.InputRequiredException;
import com.alibaba.dashscope.exception.NoApiKeyException;
import io.reactivex.Flowable;
import java.lang.System;
import java.util.Arrays;

public class Main {
    private static StringBuilder reasoningContent = new StringBuilder();
    private static StringBuilder finalContent = new StringBuilder();
    private static boolean isFirstPrint = true;
    private static String requestId = "";
    private static void handleGenerationResult(GenerationResult message) {
        requestId = message.getRequestId();
        String reasoning = message.getOutput().getChoices().get(0).getMessage().getReasoningContent();
        String content = message.getOutput().getChoices().get(0).getMessage().getContent();
        if (reasoning != null && !reasoning.isEmpty()) {
            reasoningContent.append(reasoning);
            if (isFirstPrint) {
                System.out.println("====================思考过程====================");
                isFirstPrint = false;
            }
            System.out.print(reasoning);
        }
        if (content != null && !content.isEmpty()) {
            finalContent.append(content);
            if (!isFirstPrint) {
                System.out.println("\n====================完整回复====================");
                isFirstPrint = true;
            }
            System.out.print(content);
        }
    }
    private static GenerationParam buildGenerationParam(Message userMsg) {
        return GenerationParam.builder()
                // 若没有配置环境变量，请用千问 AI 平台API Key将下行替换为：.apiKey("sk-xxx")
                .apiKey(System.getenv("DASHSCOPE_API_KEY"))
                .model("deepseek-v4-pro")
                .enableThinking(true)
                .incrementalOutput(true)
                .resultFormat("message")
                .messages(Arrays.asList(userMsg))
                .build();
    }
    public static void streamCallWithMessage(Generation gen, Message userMsg)
            throws NoApiKeyException, ApiException, InputRequiredException {
        GenerationParam param = buildGenerationParam(userMsg);
        Flowable<GenerationResult> result = gen.streamCall(param);
        result.blockingForEach(message -> handleGenerationResult(message));
    }
    public static void main(String[] args) {
        try {
            Generation gen = new Generation();
            Message userMsg = Message.builder().role(Role.USER.getValue()).content("你是谁？").build();
            streamCallWithMessage(gen, userMsg);
            System.out.println("\nRequest ID: " + requestId);
        } catch (ApiException | NoApiKeyException | InputRequiredException e) {
            System.err.println("An exception occurred: " + e.getMessage());
        }
    }
}

返回结果

====================思考过程====================

嗯，用户问了一个非常简单的自我介绍问题："你是谁"。

我需要明确自己的身份，用简洁友好的方式介绍我是DeepSeek，说明我的创造者、基本特性和可提供的帮助。

想到了可以这样组织回答：先直接表明身份，说明由深度求索公司创造，然后列出一些关键特点（免费、长上下文、文件上传等），最后以友好的邀请结束，询问是否需要帮助。
====================完整回复====================

你好！我是 DeepSeek，由深度求索公司创造的 AI 助手。

我可以帮你解答各种问题、进行文字创作、分析文档、编程辅助等等。我最大的特点是**免费使用**、**超长上下文**（能一次处理整本三体三部曲那么多内容）、支持**文件上传**和**联网搜索**（需手动开启）。

有什么我可以帮你的吗？不管是学习、工作还是日常闲聊，我都很乐意陪你聊聊！

示例代码

curl -X POST "https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation" \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-H "X-DashScope-SSE: enable" \
-d '{
    "model": "deepseek-v4-pro",
    "input":{
        "messages":[
            {
                "role": "user",
                "content": "你是谁？"
            }
        ]
    },
    "parameters":{
        "enable_thinking": true,
        "incremental_output": true,
        "result_format": "message"
    }
}'

推理强度（reasoning_effort）

deepseek-v4-pro 和 deepseek-v4-flash 默认开启思考模式。通过reasoning_effort参数可以调整推理强度，可选值为low、medium、high、xhigh和max，默认为high。其中，low和medium的效果等同于high；xhigh的效果等同于max。

OpenAI兼容
DashScope

Python
Node.js
curl

from openai import OpenAI
import os

client = OpenAI(
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
  model="deepseek-v4-pro",
  messages=[{"role": "user", "content": "9.9和9.11哪个大"}],
  reasoning_effort="high",
)
print(completion.choices[0].message.content)

import OpenAI from "openai";

const openai = new OpenAI({
  apiKey: process.env.DASHSCOPE_API_KEY,
  baseURL: "https://dashscope.aliyuncs.com/compatible-mode/v1",
});

const completion = await openai.chat.completions.create({
  model: "deepseek-v4-pro",
  messages: [{ role: "user", content: "9.9和9.11哪个大" }],
  reasoning_effort: "high",
});
console.log(completion.choices[0].message.content);

curl -X POST https://dashscope.aliyuncs.com/compatible-mode/v1/chat/completions \
-H "Authorization: Bearer $DASHSCOPE_API_KEY" \
-H "Content-Type: application/json" \
-d '{
    "model": "deepseek-v4-pro",
    "messages": [{"role": "user", "content": "9.9和9.11哪个大"}],
    "reasoning_effort": "high"
}'

import os
from dashscope import Generation

response = Generation.call(
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  model="deepseek-v4-pro",
  messages=[{"role": "user", "content": "9.9和9.11哪个大"}],
  reasoning_effort="high",
  result_format="message",
)
print(response.output.choices[0].message.content)

其它功能

模型	多轮对话	Function Calling	联网搜索	上下文缓存	结构化输出	前缀续写
deepseek-v4-pro	✓	✓	✓	✓	—	—
deepseek-v4-flash	✓	✓	✓	✓	—	—
deepseek-v3.2	✓	✓	✓	✓	—	—
deepseek-v3.2-exp	✓	✓（仅支持非思考模式）	✓	—	—	—
deepseek-v3.1	✓	✓（仅支持非思考模式）	✓	✓	—	—
deepseek-r1	✓	✓	✓	✓	—	—
deepseek-r1-0528	✓	✓	✓	—	—	—
deepseek-v3	✓	✓	✓	✓	—	—
蒸馏模型	✓	—	—	—	—	—

参数默认值

模型	temperature	top_p	repetition_penalty	presence_penalty	max_tokens	thinking_budget
deepseek-v4-pro	1.0	1.0	-	-	共393,216	共393,216
deepseek-v4-flash	1.0	1.0	-	-	共393,216	共393,216
deepseek-v3.2	1.0	0.95	-	-	65,536	32,768
deepseek-v3.2-exp	0.6	0.95	1.0	-	65,536	32,768
deepseek-v3.1	0.6	0.95	1.0	-	65,536	32,768
deepseek-r1	0.6	0.95	-	1	16,384	32,768
deepseek-r1-0528	0.6	0.95	-	1	16,384	32,768
蒸馏版	0.6	0.95	-	1	16,384	16,384
deepseek-v3	0.7	0.6	-	-	16,384	-

"-" 表示没有默认值，也不支持设置。
deepseek-r1、deepseek-r1-0528、蒸馏版模型不支持设置以上参数值。
参数含义请参考OpenAI兼容-Chat接口文档。

模型列表与计费

混合思考模型（通过enable_thinking参数控制是否思考）：deepseek-v4-pro、deepseek-v4-flash、deepseek-v3.2、deepseek-v3.2-exp、deepseek-v3.1
仅思考模型（回复前总会思考）：deepseek-r1、deepseek-r1-0528
非思考模型：deepseek-v3

deepseek-v4-pro 在编程、数学和通用任务方面表现出色，deepseek-v4-flash 快速且经济高效，推荐优先使用 deepseek-v4-pro。模型上下文长度与价格信息请参见千问 AI 平台控制台。按照模型的输入与输出 Token 计费。

思考模式下，思维链按照输出 Token 计费。

常见问题

如何接入Chatbox、Cherry Studio或Dify？

此处以常用工具为例进行说明，其它大模型工具的接入方式类似。

Chatbox
Cherry Studio
Dify

请参见 Chatbox 接入文档。

可以上传图片或文档进行提问吗？

DeepSeek 模型仅支持文本输入，不支持图片或文档输入。如需图片输入，请使用千问VL模型；如需文档输入，请使用Qwen-Long模型。

错误码

如果执行报错，请参见错误码进行解决。

​快速开始

​推理强度（reasoning_effort）

​其它功能

​参数默认值

​模型列表与计费

​常见问题

​如何接入Chatbox、Cherry Studio或Dify？

​可以上传图片或文档进行提问吗？

​错误码

快速开始

推理强度（reasoning_effort）

其它功能

参数默认值

模型列表与计费

常见问题

如何接入Chatbox、Cherry Studio或Dify？

可以上传图片或文档进行提问吗？

错误码