AI大模型日报#0527:豆包大模型披露评测成绩、天工AI日活超100万、AI初创集体跳槽OpenAI

常政 2024-06-10 15:31:03 阅读 82

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-Large)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:豆包大模型在评测中显示性能较上一代提升19%,尤其在中文能力上超越GPT-4。Snowflake通过收购AI观测平台TruEra,增强其AI数据云功能与可信度,助力企业确保AI应用准确高效。昆仑万维旗下天工AI凭借卓越技术,DAU超过100万,成为用户活跃的AI内容创作平台。中国电信发布支持30种方言的语音识别大模型,推动方言文化保护。博世团队提出参考神经算子,高效解决工业偏微分方程问题,显著降低学习复杂度。此外,CVPR 2024线上分享会公布日程,聚焦计算机视觉领域最新成果。陈丹琦团队推出SimPO方法,通过微调8B模型超越Claude3 Opus,为大型语言模型优化提供新思路。港大与字节跳动提出多模态大模型新范式Groma,模拟人类先感知后认知过程,提升交互性与指向性。马斯克则计划建造世界最大超算中心,投入10万块H100训练Grok以追赶GPT-4。同时,OpenAI在领导层股权争议和安全团队解散挑战后,迎来AI安全领域资深专家加盟,致力于加强AGI的安全准备工作。

标题: 豆包大模型披露评测成绩,较上一代“云雀”提升19%

 

摘要: 科技记者报道:豆包大模型在火山引擎原动力大会上发布,以低价策略进入市场,并在内部测试中显示出较上一代云雀模型提升19%的性能。在11个主流公开评测集上,豆包模型总分76.8分,优于其他国产模型,并在代码能力、专业知识和指令遵循方面有显著提升。尽管GPT-4在这些评测集上仍保持领先,豆包模型在中文能力上超越GPT-4。第三方评测结果预计将在未来一到两个月内公布。

网址: 豆包大模型披露评测成绩,较上一代"云雀"提升19% | 量子位

 

标题: 速递|Snowflake 宣布收购 AI 观测平台 TruEra!

摘要: Snowflake 宣布收购 AI 观测平台 TruEra,旨在增强其 AI 数据云的功能和可信度。TruEra 提供评估和监控 LLM 应用和 ML 模型的能力,帮助企业确保 AI 应用的准确性和高效性。此次收购将整合 TruEra 的技术团队,包括三位联合创始人,并进一步提升 Snowflake 在 AI 和 ML 数据治理方面的能力。Snowflake 表示,此次收购是其在生成式 AI 和机器学习能力上持续投资的一部分,以帮助客户最大化数据价值。

网址: 速递|Snowflake 宣布收购 AI 观测平台 TruEra!|Snowflake|ai|snowflake|truera|唱片|迷你专辑|音乐专辑_手机网易网

 

标题: 昆仑万维宣布天工AI每日活跃用户(DAU)超过100万

 

摘要: 昆仑万维旗下天工AI用户活跃度创新高,DAU超100万。受益于前瞻AI战略与领先产品能力,天工AI聚焦用户体验,优化产品,打造贴近用户场景的AI产品。据QuestMobile数据,3月月活跃用户近千万,成为国内AIGC APP月活跃用户第三。4月17日发布天工3.0与天工SkyMusic,模型技术强大,AI音乐领域领跑全球。4月访问量激增122.58%,增速榜单全国第二。天工AI以用户体验为中心,推出AI搜索研究/增强模式、AI PPT等功能,用户活跃度与留存数据屡创新高。智能体平台吸引用户创建UGC智能体,成为国内领先的AI智能体平台。自2023年4月17日推出以来,天工AI凭借卓越技术与领先产品性能,迅速获得用户青睐。下一步,昆仑万维将推动AI技术应用落地,优化模型技术与用户体验,打造用户首选的人工智能内容创作平台,赋能用户生成高质量AI UGC内容,为我国AI产业发展贡献力量。

网址: 昆仑万维宣布天工AI每日活跃用户(DAU)超过100万 | 机器之心

 

标题: 换了30多种方言,我们竟然没能考倒中国电信的语音大模型

 

摘要: 中国电信人工智能研究院(TeleAI)近日发布了业内首个支持30种方言自由混说的“星辰超多方言语音识别大模型”,该模型可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型。该模型通过构建超30种、超30万小时的高质量方言数据库,解决了方言数据稀疏的问题,并自主研发了星辰语音识别大模型。团队首创“蒸馏 + 膨胀”联合训练算法,实现了80层模型稳定训练,并通过超大规模语音预训练和多方言联合建模,使单一模型支持30种方言自由混说语音识别。该模型在国际权威赛事中斩获冠军,并在多项基准测试中表现出色,打破了单一模型只能识别特定单一方言的困境。星辰超多方言语音识别大模型已在多个场景中应用,包括智能客服系统,并有望在更广泛的社会生活场景中发挥价值,同时推动对方言文化的保护。

网址: 换了30多种方言,我们竟然没能考倒中国电信的语音大模型 | 机器之心

 

标题: 博世团队提出参考神经算子,学习偏微分方程解对几何变形的平滑依赖

 

摘要: 科技记者报道: 博世人工智能中心(BCAI)的研究人员开发了一种名为参考神经算子(RNO)的新型神经网络架构,旨在更高效地解决工业应用中常见的偏微分方程问题。传统的神经算子方法需要大量数据来训练模型,以确保解的准确性,这在仿真成本高昂的工程设计优化领域尤其困难。RNO 通过学习解对几何形状微小变化的依赖性,显著提高了数据利用效率。 RNO 方法的核心在于其能够预测参考解在几何形状微小扰动下的变化。这种方法不仅降低了学习复杂度,还在准确度上大幅领先基准模型,实现了高达80%的误差减少。RNO 的分层架构包括编码器、积分算子层和解码器,通过预测解的变化量而非直接预测解本身,降低了学习难度。 研究人员通过一系列实验验证了RNO的有效性,包括与多种基线模型的比较。RNO在所有测试问题上的表现均优于其他模型,尤其是在处理复杂几何形状变化的数据集时,展现了良好的泛化能力和处理自由形式变形的能力。这一创新方法为工程设计优化领域提供了高效、灵活的工具,特别是在单次仿真成本高昂的场景中。

网址: 博世团队提出参考神经算子,学习偏微分方程解对几何变形的平滑依赖 | 机器之心

 

标题: 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布

 

摘要: 自从 OpenAI 发布 ChatGPT 以来,科技界对大型语言模型和人工智能生成内容(AIGC)的关注度显著提升。在计算机视觉(CV)领域,研究热点也在不断变化。为了快速了解 AI 领域的最新科研成果与发展趋势,参加顶级会议论文分享会是一个有效途径。CVPR(计算机视觉与模式识别会议)作为 CV 领域的顶级会议,今年共收到 11532 份论文投稿,其中 2719 篇被接收,录用率为 23.6%。为了促进国内 CV 社区的学术交流,机器之心计划于 2024 年 6 月 1 日举办「CVPR 2024 线上论文分享会」,邀请 AI 社区成员参与。分享会将包括 Keynote 演讲和论文分享环节,并邀请顶级专家和论文作者就 CV 热门主题进行交流。

网址: 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布 | 机器之心

 

标题: 陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替

摘要: 科技记者报道:陈丹琦团队推出新方法SimPO,这是一种简化的RLHF(Reinforcement Learning with Human Feedback)替代方案,旨在提升大型语言模型的性能。SimPO通过微调8B模型,成功超越了Claude 3 Opus,并在多项测试中表现出色。与DPO(Direct Preference Optimization)相比,SimPO不仅性能更优,而且资源消耗更低,训练时间和GPU使用量大幅减少。 SimPO的核心在于简化训练流程,摆脱了对参考模型的依赖,并通过长度归一化的对数概率来构建奖励函数,鼓励模型生成简洁且高质量的回复。此外,SimPO还引入了奖励差异项来加强优化信号,使模型能够更清晰地区分正负样本。 在AlpacaEval 2和Arena-Hard等基准测试中,SimPO调整后的模型表现超越了其他优化方法,包括DPO。同时,SimPO的开销也大幅减少,训练时间和GPU消耗均有所降低。 尽管SimPO展现出巨大潜力,但作者也指出了一些不足,如未明确考虑安全性和诚实性,以及在某些需要密集推理的任务上表现下降。未来,团队计划通过集成正则化策略等方法来改进SimPO。 SimPO的成果已开源,并迅速被大模型微调平台Llama-Factory引进。这项技术的创新性应用为大型语言模型的优化提供了新的思路。

网址: 陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替 | 量子位

 

标题: 港大字节提出多模态大模型新范式,模拟人类先感知后认知

 

摘要: 香港大学和字节跳动商业化团队的研究人员提出了一种名为Groma的新范式,旨在提升多模态大模型的感知定位能力。Groma通过区域性图像编码来增强模型对图像中物体位置的识别,从而在视觉任务中实现更准确的定位。这种新方法允许模型将文本内容与图像区域直接关联起来,显著提升了对话的交互性和指向性。Groma的核心思路是将定位功能转移到多模态大模型的vision tokenizer中,利用vision tokenizer的空间理解能力来发现并定位潜在的物体,而无需外接专家模型。研究人员采用超过8M的数据来预训练Region Proposer,以提高定位的鲁棒性和准确性。实验结果显示,Groma在多个基准测试中表现优异,包括Grounding Benchmarks和VQA Benchmark。这种先感知后认知的模型设计不仅符合人类的视觉过程,还避免了重新训练大语言模型的计算开销。字节跳动正持续加大对顶尖人才和前沿技术的投入力度,参与行业顶尖的技术挑战和攻坚。

网址: 港大字节提出多模态大模型新范式,模拟人类先感知后认知 | 量子位

 

标题: 马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o

 

摘要: 科技巨头间的AI竞赛愈演愈烈,马斯克不甘落后,宣布将建造世界最大的超算中心。他的xAI公司发布了Grok 1.5,并计划推出Grok 2,但受限于算力不足。马斯克表示,训练Grok 2需要约2万个基于Hopper架构的英伟达H100 GPU,而Grok 3及更高版本将需要10万个H100芯片。特斯拉财报显示,公司受到算力限制,马斯克计划部署8.5万个H100 GPU。他希望在2025年秋季前让这台超级计算机运行起来,并与Oracle合作共建。这个「超级计算工厂」一旦完工,规模将至少是当前最大GPU集群的4倍。然而,Meta、微软和OpenAI也在积极扩建算力,竞争激烈。英伟达成为关键供应商,其H100和即将推出的B100 GPU将助力科技巨头升级算力。马斯克还指出,除了芯片短缺,电力供应将成为未来AI发展的主要限制因素。

网址: 马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o|英伟达|马斯克|电力_新浪新闻

 

标题: AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!

 

摘要: OpenAI面临领导层股权争议和AI安全团队解散的双重挑战。据报道,高级领导层对股权回收条款知情并签署,而安全团队的解散和未兑现的资源承诺引发了外界对OpenAI安全承诺的质疑。然而,随着Indent的CEO Fouad Matin及其团队加入OpenAI,致力于AGI安全准备,公司似乎正在重整旗鼓。Matin在AI安全和产品设计方面有着丰富的经验,他的加入可能会为OpenAI的安全工作带来新的活力。

网址: AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!|AI_新浪新闻

 



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。