本文档介绍如何在千问云调用阶跃星辰(Stepfun)直供的 Step 系列模型推理服务。
快速开始
stepfun/step-3.7-flash 是阶跃星辰直供的多模态推理模型,默认关闭思考模式,您可以通过设置enable_thinking为true开启思考模式。开启后,模型的推理过程通过reasoning_content字段返回,您可以通过reasoning_effort参数(可选值:low、medium、high)控制推理深度。运行以下代码快速调用 stepfun/step-3.7-flash 模型。
需要已获取 API Key 并完成配置 API Key 到环境变量。如果通过 SDK 调用,需要安装 SDK。
- Python
- Node.js
- HTTP
多模态调用示例
stepfun/step-3.7-flash 不仅支持纯文本对话,还具备多模态理解能力,支持图像和视频输入。
图像理解
图像理解功能让模型能够识别和分析图像内容。支持通过公网 URL 或 Base64 编码传入图像。图像文件的限制请参见文件限制。
- Python
- Node.js
- HTTP
视频理解
视频理解功能让模型能够识别和分析视频内容。支持通过公网 URL 传入视频。视频文件的限制请参见文件限制。
- Python
- Node.js
- HTTP
文件限制
- 图像文件
- 视频文件
- **支持的图像格式:**JPG/JPEG、PNG、WEBP、静态 GIF
- **单张图像大小:**不超过 10M
- **多图输入限制:**单次请求最多 50 张图像,多张图片总大小不超过 20M
- **图像分辨率:**建议长或宽不超过 4096 像素。分辨率越高,模型推理成本越高(网络传输时间、首字延迟和费用消耗相应增加)
- **图像传入方式:**支持通过 HTTP/HTTPS 公网 URL 或 Base64 编码传入
其它功能
| 功能 | 支持情况 | 备注 |
|---|---|---|
| 多轮对话 | 支持 | 思考模式下需在每轮 assistant 消息中保留reasoning_content字段,否则会报错 |
| Function Calling | 支持 | 不支持tool_choice参数 |
| 上下文缓存 | 支持 | 支持隐式缓存,自动开启 |
| 结构化输出 | 支持 | response_format不支持 json_schema |
| 联网搜索 | 不支持 | — |
| 前缀续写 | 不支持 | — |
| 多模态输入 | 支持 | 支持图像(URL/Base64)和视频(URL)输入 |
tool_choice、thinking_budget、top_k、modalities、repetition_penalty、vl_high_resolution_images、preserve_thinking、enable_search、search_options、seed、logprobs、top_logprobs、n。
支持的参数中,部分参数取值范围与功能与千问云不一致:
| 参数 | 千问云 | Step |
|---|---|---|
temperature | 取值范围 [0, 2) | 取值范围 [0, 2),默认 1.0 |
top_p | 取值范围 (0, 1.0] | 取值范围 (0, 1.0],默认 0.95 |
max_tokens | 不限制思考模型思维链长度,仅限制输出长度 | 限制思考过程和最终回答的总体输出长度 |
reasoning_effort | 控制 DeepSeek-V4 系列模型的推理力度,可选值high/max | 可选值为low、medium、high,用于控制推理深度,需开启思考模式后生效 |
stream_options | 其属性include_usage默认为false,可设为true | 其属性include_usage强制为true,无法关闭 |
detail | 不支持 | 可选low/high,默认low |
frequency_penalty | 不支持 | 范围 0.0~1.0,默认 0 |
模型列表与计费
Step 系列模型是阶跃星辰直供的多模态推理模型,支持文本、图像和视频输入,支持通过enable_thinking开启思考模式。
模型上下文长度与价格信息请参见千问云控制台。
按照模型的输入与输出 Token 计费。
思考模式下,思维链按照输出 Token 计费。
错误码
Step 系列模型由阶跃星辰直供,其错误码与千问云标准错误码存在差异。调用 Step 模型时,请以下表为准。
| 错误码 | 错误原因 | 解决方法 |
|---|---|---|
| 400 - 格式错误 | 请求参数格式不正确,可能包括图片无法下载、图片数量超限、模型不支持的输入类型、参数值不合法 | 检查请求体、模型能力和参数范围 |
| 401 - 认证失败 | 缺少或无效的 API Key | 检查 API Key 及请求头格式是否正确 |
| 402 - 余额不足 | 账户余额不足 | 检查账户余额,及时进行充值 |
| 429 - 请求超限 | 请求过于频繁,超出速率限制 | 实现指数退避和重试逻辑,或降低请求频率 |
| 451 - 内容拦截 | 请求内容或响应内容未通过审核 | 修改请求内容,避免输入不安全或敏感内容 |
| 500 - 服务器失败 | 服务器内部故障 | 请稍后重试,持续出现时联系我们解决 |
| 503 - 服务器故障 | 服务器负载过高 | 请稍后重试 |