《AI学习笔记》大模型-微调/训练区别以及流程

之前一直对于大模型的微调和训练这两个名词不是很清晰,所有找了一个时间来弄明白到底有什么区别以及到底要怎么去使用去做。并且上手实践一下。_大模型微调和训练的区别...

AI大模型探索之路-训练篇23:ChatGLM3微调实战-基于P-Tuning V2技术的实践指南

在人工智能的广阔领域里,大语言模型(LLMs)的微调技术扮演着至关重要的角色。它不仅为模型注入了适应特定任务的能力,而且还是通往专业领域的关键。本文旨在深入探讨基于P-TuningV2技术的ChatGLM3...

AI大模型探索之路-训练篇15:大语言模型预训练之全量参数微调

在自然语言处理(NLP)领域,预训练模型的应用已经越来越广泛。预训练模型通过大规模的无监督学习,能够捕捉到丰富的语言知识和上下文信息。然而,由于预训练模型通常需要大量的计算资源和时间进行训练,因此在实际使用时,我...

AI大模型探索之路-训练篇20:大语言模型预训练-常见微调技术对比

随着人工智能的迅猛发展,自然语言处理(NLP)在近年来取得了显著的进展。大型语言模型(LLMs)在多种NLP任务中展现了卓越的性能,这得益于它们在大规模文本数据集上进行的预训练和随后的微调过程。这些模型不仅能够理...

AI大模型探索之路-训练篇1:大语言模型微调基础认知

在人工智能的广阔研究领域内,大型预训练语言模型(LargeLanguageModels,LLMs)已经成为推动技术革新的关键因素。这些模型通过在大规模数据集上的预训练过程获得了强大的语言理解和生成能力,使其...

书生·浦语大模型实战营 第八节课 微调弱智吧(如果AI可以正确回答弱智吧的所有问题,人类在AI眼里都是弱智吧!)
AI | LLaMA-Factory 一个好用的微调工具

有效的微调已成为大型语言模型(LLMs)适应特定任务的必要条件之一。然而,这需要一定的努力,有时也相当具有挑战性。随着Llama-Factory的引入,这一全面的框架让训练更加高效,用户无需编写代码即可轻松为...

只需30分钟,微调阿里 Qwen2-7B,搭建专属 AI 客服

LLaMA-Factory在data文件夹中提供了多个训练数据集示例,支持alpaca或sharegpt格式,不过我这里使用的是自己提前导出来做过处理的自定义数据集。自定义数据集选用alpaca因为我只有标注后的问...

AI直播换脸——DeepFaceLab 3.0模型训练与微调

DeepFaceLab是一种基于深度学习的人脸合成和转换工具。它使用了深度神经网络来分析和修改图像中的人脸部分,可以实现将一个人的脸部特征应用到另一个人的照片上,或者进行面部表情、年龄、性别等特征的变换。DeepF...

AI大模型探索之路-训练篇17:大语言模型预训练-微调技术之QLoRA

在深度学习的不断进步中,大型语言模型(LLMs)的预训练和微调技术成为了研究的热点。其中,量化技术以其在模型压缩和加速方面的潜力备受关注。本文将深入探讨QLoRA(QuantizedLow-RankAdap...