跳转到主要内容
数据集

创建数据集

上传训练数据到千问云用于微调任务。

本指南介绍如何在千问云控制台中创建数据集。

前提条件

  • 一个可访问控制台的千问云账号。
  • 已准备 JSONL 格式的数据文件。格式要求请参见数据集概览

创建数据集

打开数据集页面

前往数据集页面,点击创建数据集

输入数据集名称

为数据集提供一个描述性名称。

选择任务类型

选择文本生成作为任务类型。

选择微调算法

SFT(监督微调)为微调算法。

上传文件

将文件拖放到上传区域或点击浏览。支持格式:JSONL(每文件最大 200 MB,最多 10 个文件)。

提交

点击保存草稿创建数据集。
您的数据集现在处于草稿状态。必须先发布才能在微调任务中使用。详见发布数据集
创建页面右侧面板显示文件格式要求和所选算法的示例文件下载链接。

SFT 示例格式

{
  "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Explain gravity in simple terms."},
    {"role": "assistant", "content": "Gravity is the force that pulls objects toward each other."}
  ]
}

下一步

创建数据集 - 千问云