跳转到主要内容
微调

超参数参考

千问云专家模式下所有微调超参数的参考说明。

超参数控制模型在微调中的学习方式。在简易模式下,千问云使用优化后的默认值。在专家模式下,您可以在控制台或通过 API 自定义所有参数。

超参数表

参数默认值范围说明
batch_size168 -- 1024每步处理的训练样本数。值越大稳定性越好,但需要更多内存。
learning_rate0.0001> 0控制权重更新的幅度。过大导致不稳定,过小导致收敛过慢。
n_epochs31 -- 200完整遍历训练数据集的次数。epoch 越多,训练时间和成本越高。
eval_steps501 -- 2147483647两次验证评估之间的训练步数。值越低指标越频繁,但会拖慢训练。
lr_scheduler_typeLinearLinear, Cosine, Inverse Sqrt训练期间调整学习率的策略。
max_length32768500 -- 32768单个训练样本的最大 Token 长度。超过此长度的样本将被丢弃。
warmup_ratio0.10 -- 1用于学习率预热的训练步数比例。预热有助于稳定早期训练。
weight_decay0.010 -- 0.2L2 正则化强度。有助于防止过拟合,维持泛化能力。
lora_rank648, 16, 32, 64, 128LoRA 适配器矩阵的秩。值越高容量越大,但计算成本也越高。
lora_alpha168, 16, 32, 64LoRA 更新的缩放因子。控制适配器相对于基模型的影响程度。
lora_dropout0.050 -- 0.2LoRA 层的 Dropout 率。有助于防止适配器权重过拟合。

LoRA 专属参数

lora_ranklora_alphalora_dropout 三个参数是所有微调任务使用的 LoRA 训练方法专属参数。

调参建议

  • 从默认值开始。 默认值适用于大多数场景。仅在初始结果不理想时才调整参数。
  • 谨慎调整学习率。 如果训练 loss 不下降,尝试增大学习率。如果 loss 不稳定或剧烈波动,则降低学习率。
  • 监控验证指标。 使用任务详情页的指标标签页观察过拟合——当验证 loss 上升而训练 loss 持续下降时即为过拟合。
  • 小数据集增加 epoch。 训练样本较少时,更多 epoch 可以让模型有更多机会学习规律。
  • 大学习率使用预热。warmup_ratio 设为 0.05 -- 0.1 有助于避免早期训练的不稳定。