阿里开源语音理解和语音生成大模型FunAudioLLM

阿里开源大模型FunAudioLLM,一个创新的框架,旨在促进人类与大型语言模型(LLMs)之间的自然语音交互。FunAudioLLM的核心是两个开创性的模型:用于语音理解的SenseVoice和用于语音生成的C...

【AI大模型】从零开始运用LORA微调ChatGLM3-6B大模型并私有数据训练_chalm3进行lora训练

ChatGLM3是智谱AI和清华大学KEG实验室联合发布的对话预训练模型。ChatGLM3-6B是ChatGLM3系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,Chat...

一文了解大模型的三种类型

基座模型(base模型)、聊天模型(chat模型)和指令模型(instruct模型)分别是什么?_大模型instruct版本...

解读「快意」大模型关键技术,揭秘实践中的挑战与创新

为了提升路由模块预测的准确性和解决上述路由错误导致的expert优化不理想问题,「快意」大模型团队提出了基于训练过程中token梯度分布的自适应错误检测策略,并基于检测的结果,提出了新的路由loss优化方案,最终...

Qwen2-Math,新一代数学模型

原文链接:https://qwenlm.github.io/zh/blog/qwen2-math/友情链接Github:https://github.com/QwenLM/Qwen2-MathHuggingFace:https://huggingfac...

【AI大模型】解锁AI智能:从注意力机制到Transformer,再到BERT与GPT的较量

在AI技术的迅猛发展中,注意力机制成为了关键驱动力,赋予机器高效处理复杂信息的能力。本文深入探索注意力机制及其核心应用——Transformer架构,解析其如何通过自注意力机制革新自然语言处理。同时,对比分析GP...

AI大模型避坑(一):Tabby如何安装在windows端成功安装,应该选择哪个版本

如果你有NVIDIA显卡,可以选择相应的CUDA版本或普通版本。如果你没有NVIDIA显卡或者未安装CUDA工具包,选择普通版本(tabby_x86_64-windows-msvc.zip)。如果你的显卡支持Vulk...

大模型日报|11 篇必读的大模型论文

大模型日报|11篇必读的大模型论文_diffusionforcing...

深度解析:Safetensors——新一代模型权重存储格式的全面指南

Safetensors是一种用于安全地存储张量的新格式,非常简单,但速度仍然很快(零拷贝)。它是pickle格式的替代品,因为,pickle格式不安全,可能包含可以执行的恶意代码。本文简要介绍了模型权重存储新格...

智谱AI最新开源模型CHATGLM4-9B试用

具备1120*1120高分辨率下的中英双语多轮对话能力,在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中,GLM-4V-9B表现出超越GPT-4-turbo-2024-04-09、Gemi...