Llama3.1的简要解读。总结几点,大而好:405B参数直接对标GPT4(Scalinglaw)中杯(8B)和大杯(70B)的上下文直接干到128K了,超过目前同类参数模型一个等级。15T的Token,强调...
浏览 53 次 标签: Llama3.1技术报告简要解读--附PDF