本地多卡(3090)部署通义千问Qwen-72B大模型提速实践:从龟速到够用

本文记录了多卡部署72B通义千问过程,将推理速度提到10token/s水平。_千问72b部署...

AI大模型技术的四大核心架构演进之路(非常详细)零基础入门到精通,收藏这一篇就够了

大模型技术的不断进步为AI领域带来了新的可能性。通过深入理解不同技术架构的特性和应用场景,我们可以更好地利用这些技术,推动AI技术的发展和应用。_大模型技术架构...

大模型-基于大模型的数据标注

法来自于这篇论文:CanGeneralistFoundationModelsOutcompeteSpecial-PurposeTuning?_大模型数据标注...

开箱即用:如何在本地轻松部署大模型(附详细API指南)

Ollama是一款开源的大型语言模型服务工具,专为简化和优化在本地运行大型语言模型而设计。它将模型权重、配置和数据捆绑到一个包中,称之为Modelfile。这样,用户无需手动设置和调整模型的细节,只需简单配置即可...

LoRA大模型微调的利器

LoRA模型是小型的StableDiffusion模型,它们对checkpoint模型进行微小的调整。它们的体积通常是检查点模型的10到100分之一。因为体积小,效果好,所以lora模型的使用程度比较高。...

阿里重磅开源Qwen2-VL:超越人类的视觉理解能力,从医学影像到手写识别,这款开源多模态大模型究竟有多强?(附本地化部署教程)

阿里重磅开源Qwen2-VL:超越人类的视觉理解能力,从医学影像到手写识别,这款开源多模态大模型究竟有多强?(附本地化部署教程)模型介绍最近呢,阿里巴巴开源了Qwen2-VL,在多模态大模型展现了在实际应用中的巨大潜力,尤其是在处理跨模态数据方面表现出众。...

AI巨变揭秘:四大技术架构撑起大模型革命

大模型技术架构从纯Prompt的简单对话,到Agent+FunctionCalling的主动交互,再到RAG的高效检索,最终到Fine-Tuning的深入学习,每一种架构都有其独特的优势和应用场景。理解这些技...

玩转Docker:Lsky pro图床+私有化部署大模型(Ollama+Openwebui)

最近搞了一个测试服务器,捣鼓了下一键搭建dnmp集成环境,然后还搭建了一个Lyskpro图床服务,后面又看到了开源大模型,也试着搭建了一下,中间出了一点小插曲。不过也算搭建成功了。做一个小结汇总。_lskypro...

阿里大模型,拿下全球第一

作为阿里云精心筹备的“大招”,通义千问第二代开源模型Qwen2-72B亮相即登顶。6月27日凌晨,全球著名开源平台HuggingFace(笑脸)的联合创始人兼首席执行官在社交平台表示,在新一轮的全球开源大模型评...

(AI大模型书籍)掌控未来: 三本不可错过的AI大模型开发宝典

本文特别推荐三本不可错过的AI大模型开发宝典。这些书籍提供了大量实践案例与代码示例,帮助读者逐步掌握从模型构建到优化的各个环节和罄尽。_三本ai大模型开发...