AI | LLaMA-Factory 一个好用的微调工具
程序圆明员 2024-06-21 10:01:02 阅读 71
‘’
LLama Factory,这个工具能够高效且低成本地支持对 100 多个模型进行微调。LLama Factory 简化了模型微调的过程,并且易于访问,使用体验友好。此外,它还提供了由 Hiyouga 提供的 Hugging Face 空间,可用于对模型进行微调。
下载LLaMA-Factory
#下载LLaMA-Factorygit clone https://github.com/hiyouga/LLaMA-Factory.git#创建一个环境conda create -n llama_factory python=3.10#切换到llama_factory环境conda activate llama_factory#进入到LLaMA-Factory目录下cd LLaMA-Factory#下载LLaMA-Factory所需要的包pip install -r requirements.txt
开始
启动页面:
python src\train_web.py
进入可视化页面:
支持 Lora 和 GaLore 配置,以减少 GPU 的使用。用户可以通过简单的滑块轻松更改参数,如 dropout、epochs、批次大小等。同时,也有多个数据集选项可供选择以微调你的模型。正如本文所述,LLama Factory支持许多模型,包括不同版本的 LLama、mistral 和 Falcon。它还支持像 galore、badm 和 Lora 这样的高级算法,提供诸如flash attention、位置编码和缩放等各种功能。
此外,你还可以集成像 TensorBoard、VanDB 和 MLflow 这样的监控工具。为了更快地进行推理,你还可以使用Gradio 和 CLI。本质上,LLama Factory 提供了一系列多样化的选项,以增强模型性能并简化微调过程。
LLaMA-Factory有自带的数据集也可以自己生成数据集然后导入:
自制微调数据集代码下载地址:
https://github.com/KevinFanng/makeChatGLM3FinetuneData/blob/main/finetunningData_for_qwen_piliang.py
自制微调数据集代码读取Excel示例:
https://github.com/KevinFanng/makeChatGLM3FinetuneData/blob/main/%E5%8E%9F%E5%A7%8B%E6%95%B0%E6%8D%AE%E6%A0%BC%E5%BC%8F.xlsx
自制微调数据集代码关键注释:
预览命令:
开始微调,点击开始:
微调所需要的时间百分比:
报错:
我当时跑的期间也会有报错,但是只要跟着教程走,就不会错,当时我的报错是关于torch版本的问题,原因是没有下载对应cuda的torch, 我当时候的解决方案是去torch官网下载对应自己版本的cuda。
进入PyTorch官网:PyTorch(魔法)
Windows+R打开cmd小黑框:
查看你的cuda版本:nvidia-smi
找到对应的cuda版本下载即可!
可视化界面偶尔可能也出现报错,我们重新刷新页面即可继续
结语
有效的微调已成为大型语言模型(LLMs)适应特定任务的必要条件之一。然而,这需要一定的努力,有时也相当具有挑战性。随着 Llama-Factory 的引入,这一全面的框架让训练更加高效,用户无需编写代码即可轻松为超过 100 个 LLMs 定制微调。
现在,很多人对大型语言模型(LLMs)更加好奇,有这样想法的开发者可以试试 Llama-Factory 是否可以调整自己的模型。这有助于开源社区的成长和活跃。Llama-Factory 正变得广为人知,甚至已被列入 Awesome Transformers3 中,作为高效微调 LLMs 的工具。
我们希望本文能鼓励更多开发者使用这一框架来创建有价值的 LLMs。不过请记得,在使用Llama-Factory微调LLMs时,遵守模型的许可规则很重要。
至此,本文结束。我们看到了如今在几分钟内微调任何模型是多么容易。我们还可以使用 Hugging Face CLI 将这个模型推送到 Hugging Face Hub 上。
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。