跳转到主要内容
三方模型

DeepSeek-硅基流动

本文档介绍如何在千问云平台通过OpenAI兼容接口或DashScope SDK调用硅基流动提供的DeepSeek系列模型。

千问云提供两个推理服务供应商的DeepSeek模型服务,硅基流动供应商支持更长上下文;千问云供应商限流条件更宽松,且支持联网搜索与上下文缓存功能。

服务开通

  1. 前往千问云控制台,搜索 deepseek,找到 SiliconFlow DeepSeek 模型卡片,单击立即开通;
  2. 在弹窗内确认开通及授权。
完成以上步骤即可调用硅基流动提供的 DeepSeek 模型服务。

快速开始

deepseek-v3.2 是 DeepSeek 系列最新模型,支持通过enable_thinking参数设置思考与非思考模式。运行以下代码快速调用思考模式的 deepseek-v3.2 模型。 需要已获取API Key并完成安装SDK。如果通过SDK调用,需要配置API Key到环境变量。
  • OpenAI兼容
  • DashScope
enable_thinking非 OpenAI 标准参数,OpenAI Python SDK 通过 extra_body传入,Node.js SDK 作为顶层参数传入。
  • Python
  • Node.js
  • HTTP

示例代码

from openai import OpenAI
import os

# 初始化OpenAI客户端
client = OpenAI(
  # 如果没有配置环境变量,请用千问云API Key替换:api_key="sk-xxx"
  api_key=os.getenv("DASHSCOPE_API_KEY"),
  base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

messages = [{"role": "user", "content": "你是谁"}]
completion = client.chat.completions.create(
  model="siliconflow/deepseek-v3.2",
  messages=messages,
  # 通过 extra_body 设置 enable_thinking 开启思考模式
  extra_body={"enable_thinking": True},
  stream=True,
  stream_options={
    "include_usage": True
  },
)

reasoning_content = ""  # 完整思考过程
answer_content = ""  # 完整回复
is_answering = False  # 是否进入回复阶段
print("\n" + "=" * 20 + "思考过程" + "=" * 20 + "\n")

for chunk in completion:
  if not chunk.choices:
    print("\n" + "=" * 20 + "Token 消耗" + "=" * 20 + "\n")
    print(chunk.usage)
    continue

  delta = chunk.choices[0].delta

  # 只收集思考内容
  if hasattr(delta, "reasoning_content") and delta.reasoning_content is not None:
    if not is_answering:
      print(delta.reasoning_content, end="", flush=True)
    reasoning_content += delta.reasoning_content

  # 收到content,开始进行回复
  if hasattr(delta, "content") and delta.content:
    if not is_answering:
      print("\n" + "=" * 20 + "完整回复" + "=" * 20 + "\n")
      is_answering = True
    print(delta.content, end="", flush=True)
    answer_content += delta.content

返回结果

====================思考过程====================

啊,用户问我是谁,这是个简单的自我介绍问题。需要清晰说明身份、开发背景、核心功能和特点,避免过度复杂化。

可以用公司背景和AI属性作为开头,再列举关键能力让用户快速了解价值,最后用友好语气收尾保持开放性。想到了强调免费、长上下文、文件处理这些实用点,再加个表情显得亲切些。

注意不用提内部技术细节,重点放在用户能直接感知的用途上。
====================完整回复====================

你好!我是DeepSeek,由深度求索公司创造的AI助手!

我是一个纯文本模型,拥有128K的上下文处理能力,完全免费为大家服务。虽然我不支持多模态识别功能,但我可以帮你处理上传的图像、txt、pdf、ppt、word、excel等文件,从中读取文字信息进行分析处理。

我的知识截止到2024年7月,还支持联网搜索功能(需要你手动点开联网搜索按键)。你可以通过官方应用商店下载我的App来使用。

我很乐意帮你解答各种问题,无论是学习、工作、生活还是创作方面的疑惑,我都会热情细致地为你提供帮助!有什么想了解的或者需要我协助的吗?
====================Token 消耗====================

CompletionUsage(completion_tokens=239, prompt_tokens=5, total_tokens=244, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=None, audio_tokens=None, reasoning_tokens=95, rejected_prediction_tokens=None, text_tokens=144), prompt_tokens_details=None)

其它功能

模型工具调用Function Call流式输出异步调用系统消息前缀续写
siliconflow/deepseek-v3.2✓(仅非思考模式)
siliconflow/deepseek-v3.1-terminus✓(仅非思考模式)
siliconflow/deepseek-r1-0528
siliconflow/deepseek-v3-0324

参数默认值

模型temperaturetop_prepetition_penaltypresence_penalty
siliconflow/deepseek-v3.21.01.0--
siliconflow/deepseek-v3.1-terminus1.01.0--
siliconflow/deepseek-r1-05281.01.0--
siliconflow/deepseek-v3-03241.01.0--
"-" 表示没有默认值,也不支持设置。

模型列表与计费

硅基流动基于自研推理引擎,为DeepSeek模型提供低延迟、高稳定性的推理服务。
  • 混合思考模型(通过enable_thinking参数控制是否思考):siliconflow/deepseek-v3.2、siliconflow/deepseek-v3.1-terminus
  • 仅思考模型(回复前总会思考):siliconflow/deepseek-r1-0528
  • 非思考模型:siliconflow/deepseek-v3-0324
siliconflow/deepseek-v3.2 模型在代码和数学等任务上表现优异,且价格最低,推荐优先使用。 模型上下文长度与价格信息请参见千问云控制台 按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。

错误码

如果执行报错,请参见错误码文档进行解决。