关于GLM-4的资讯_GLM-4相关的资讯_IT资讯网

聊聊GLM-4-9B开源模型的微调loss计算

聊聊GLM-4-9B开源模型的微调loss计算

2024-06-12 10:43:00

概述Github官方地址：GLM-4网上已经有很多关于微调的文章，介绍各种方式下的使用，这里不会赘述。我个人比较关心的是微调时的loss计算逻辑，这点在很多的文章都不会有相关的描述，因为大多数人都是关心如何使用之类的应用层，而不是其具体的底层逻辑，当然咱也...

浏览 64 次标签：微调大模型 GLM4

本地部署GLM-4-9B清华智谱开源大模型方法和对话效果体验

本地部署GLM-4-9B清华智谱开源大模型方法和对话效果体验

2024-06-10 16:13:04

清华大学和智谱AI推出了全面升级的新一代基座大模型GLM-4，整体性能相比GLM3提升60%，支持128K上下文，可根据用户意图自主理解和规划复杂指令、完成复杂任务……...

浏览 75 次标签： AI工具 AI AI大模型人工智能