关于模型的资讯_模型相关的资讯

2024-08-21 16:01:05

数字人也称为DigitalHuman或MetaHuman，是运用数字技术创造出来的、与人类形象接近的数字化人物形象。应用包括但不限于直播、软件制作、教育、科研等领域。目前数字人模型效果最好的是ER-NeRF，其...

2024-08-21 15:31:02

OpenAI是一家领先的人工智能研究公司，开发了多种大语言模型，现如今GPT-4o以及GPT-4omini等版本都已经推出。使用国内镜像站是相对而言，使用ChatGPT更为直接简单的方法，但是毕竟不是官方途径，...

2024-08-21 14:31:01

近年来，随着计算机技术和大数据的快速发展，深度学习在各个领域取得了显著的成果，如自然语言处理，图片生成，工业数字化等。为了提高模型的性能，研究者们不断尝试增加模型的参数数量，从而诞生了大模型这一概念。大模型源于深度...

2024-08-21 14:01:02

在人工智能的浪潮中，视频生成技术正成为创新的前沿。8月6日智谱AI宣布开源了其与“清影”同源的视频生成模型——**CogVideoX**。这不仅是技术的一次飞跃，更是对整个视频生成行业生态的一次重要贡献。本文将...

2024-08-21 12:31:02

阿里开源大模型FunAudioLLM，一个创新的框架，旨在促进人类与大型语言模型（LLMs）之间的自然语音交互。FunAudioLLM的核心是两个开创性的模型：用于语音理解的SenseVoice和用于语音生成的C...

2024-08-21 11:31:02

ChatGLM3是智谱AI和清华大学KEG实验室联合发布的对话预训练模型。ChatGLM3-6B是ChatGLM3系列中的开源模型，在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上，Chat...

2024-08-21 10:31:02

基座模型（base模型）、聊天模型（chat模型）和指令模型（instruct模型）分别是什么？_大模型instruct版本...

2024-08-21 10:01:02

为了提升路由模块预测的准确性和解决上述路由错误导致的expert优化不理想问题，「快意」大模型团队提出了基于训练过程中token梯度分布的自适应错误检测策略，并基于检测的结果，提出了新的路由loss优化方案，最终...

2024-08-21 08:13:00

原文链接：https://qwenlm.github.io/zh/blog/qwen2-math/友情链接Github：https://github.com/QwenLM/Qwen2-MathHuggingFace：https://huggingfac...

浏览 74 次标签：程序 · 杂谈

2024-08-20 17:01:01

在AI技术的迅猛发展中，注意力机制成为了关键驱动力，赋予机器高效处理复杂信息的能力。本文深入探索注意力机制及其核心应用——Transformer架构，解析其如何通过自注意力机制革新自然语言处理。同时，对比分析GP...