LlamaFactory 模型微调关键参数

张

张建站

2026/4/17 17:22:27

10分钟阅读

以下是LlamaFactory 模型微调关键参数的详细解析表涵盖参数含义、使用场景、解决的问题及建议取值结合技术实践与搜索结果综合整理LlamaFactory 微调关键参数解析表参数类别参数名称含义使用场景解决的问题建议设置值基础配置finetuning_type微调方法选择- 资源有限选lora/qlora- 显存充足选full- 快速迭代选freeze平衡效果与资源消耗lora默认或qlora显存不足时model_name_or_path预训练模型路径或 Hugging Face ID指定基础模型如 LLaMA-3、Qwen模型加载失败、路径错误本地绝对路径或标准 HF 标识符如meta-llama/Llama-3-8Bcutoff_len输入序列最大 Token 长度- 短文本任务分类128-512- 长文本任务生成1024-8192长文本信息丢失、显存溢出匹配模型上下文长度如 LLaMA-3 设为8192训练效率learning_rate参数更新步长控制- 全参数微调小学习率- LoRA 微调较大学习率训练震荡过大或收敛慢过小1e-5全参数或1e-4LoRAper_device_train_batch_size单 GPU 批大小根据 GPU 显存调整显存不足Batch 过大或训练慢Batch 过小2-824GB 显存配合梯度累积使用gradient_accumulation_steps梯度累积步数模拟大批量训练显存不足时小 Batch 导致训练不稳定8Batch2 时等效 Batch16num_train_epochs训练轮次- SFT 任务多轮次- DPO/PPO 任务少轮次过拟合轮次过多或欠拟合轮次过少3-10SFT或1-3DPO/PPOLoRA 优化lora_rank低秩矩阵的秩参数量控制适配器复杂度参数量过大显存不足或表达能力不足秩过小8-64简单任务取小值复杂任务取大值lora_alpha适配器权重缩放系数调节 LoRA 权重影响力微调效果弱Alpha 过小或过拟合Alpha 过大2 * lora_rank如 Rank8 → Alpha16lora_dropout适配器 Dropout 率防止过拟合训练集过拟合、泛化能力差0.05-0.1数据量少时启用quantization_bit量化为 4/8 位精度显存极度紧张场景如单卡 4090 训练 7B 模型显存不足导致 OOM4QLoRA或8平衡精度与显存结构控制lora_targetLoRA 作用的目标层聚焦关键层如注意力模块无效参数更新层选择错误q_proj,v_proj注意力层或all全层flash_attn启用 FlashAttention-2 加速长序列或大模型训练注意力计算慢、显存占用高auto自动检测硬件支持rope_scaling扩展上下文长度的位置编码策略处理超长文本8K Token长文本位置编码溢出dynamic动态 NTK或yarn验证与监控val_size验证集比例监控过拟合过拟合未被及时发现0.1数据量少或0.05数据量大plot_loss绘制训练损失曲线实时观察收敛情况难以诊断训练异常如 Loss 震荡True必开启关键参数组合建议根据不同场景推荐配置模板显存有限场景单卡 24GB 以下finetuning_type:qloraquantization_bit:4lora_rank:8lora_alpha:16gradient_accumulation_steps:8flash_attn:auto长文本任务如文档生成cutoff_len:8192rope_scaling:dynamicflash_attn:on多 GPU 分布式训练device_count:4deepspeed_stage:2# ZeRO-2 优化器分片注意事项参数优先级显存优化精度调整结构扩展即优先通过量化和 LoRA 解决资源问题再调整学习率等超参数。动态调整若训练损失震荡降低学习率×0.8或增大梯度裁剪阈值max_grad_norm若收敛慢增加 Batch Size 或学习率×1.2。模板兼容性template参数如llama3必须与基础模型预训练格式一致否则会导致输出乱码。更多实践案例可参考 https://llamafactory.readthedocs.io/ 或社区教程。

Cadence IC617 在 Ubuntu 18.04 上的完整安装与避坑指南

1. 环境准备与系统配置在Ubuntu 18.04上安装Cadence IC617前，需要做好充分的系统环境准备。我实测发现，跳过这些步骤会导致后续安装过程中出现各种奇怪错误。首先确保你的系统已经更新到最新状态： sudo apt update && sudo apt upgr…...

2026/4/17 17:09:22 阅读更多 →

如何快速提升下载效率：8个网盘解析工具的完整指南

如何快速提升下载效率：8个网盘解析工具的完整指南【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / 天翼云盘…...

2026/4/17 17:09:07 阅读更多 →

笔记本外接显示器总踩坑？手把手教你正确设置方法

明明花了不少钱入手高刷显示器，接上笔记本后，用起来反而比自带屏幕还卡顿？外接显示器玩游戏，帧数直接大幅下降，体验还不如不接？如果你也遇到过这些问题，先别急着怪显示器不好用。笔记本外接显示…...

2026/4/17 17:07:27 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/16 22:05:04 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/16 14:29:57 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/16 17:42:46 阅读更多 →