马斯克xAI融资60亿遭LeCun怒喷;中国AI辅导应用席卷美国市场 | AI头条

AI科技大本营 2024-06-11 08:01:06 阅读 68

整理 | 王启隆

出品 | AI 科技大本营(ID:rgznai100)

47cee89655525ee3ce8194096b634021.png

一分钟速览新闻点!

2024 Q1 全球 AI 融资降温

马斯克的 xAI 获 60 亿美元融资,Meta 主管 LeCun 愤然开炮

中国 AI 辅导应用席卷美国市场

苹果将为 Safari 浏览器增加 AI 功能

Stability AI 推出文生图聊天机器人 Stable Assistant

清华大学革新 YOLOv10 登 GitHub 热榜

清华大学携手华为诺亚方舟实验室打造 iVideoGPT

607a7a5b1104e9cb0d6d4bc985a71168.png

全球 AI 要闻

2024 Q1 全球 AI 融资降温:投资总额 1564 亿,Lambda、Mistral AI 引领风潮,Databricks 推新模型逐鹿

近日,摩根士丹利发布报告,2024 年第一季度全球 AI 与机器学习领域在投资市场稍显降温,共录得 179 笔融资交易,总金额达 216 亿美元(约 1564.27 亿人民币),较去年同期下降 31.2%。值得注意的是,本季大额融资事件中,Anthropic、Mistral AI 和 xAl 三家公司贡献了 53 亿美元(约 383.83 亿人民币),预示着基础模型领域的持续火热。

Lambda、Mistral AI 和 Celestial AI 成为焦点,分别在 C 轮、A 轮和种子轮中获得显著估值提升,Lambda 公司估值跃升至 15 亿美元,Mistral AI 与 Celestial AI 则分别达到 20 亿与 12 亿估值。AI 芯片企业 Astera Labs 凭借与英特尔、英伟达的合作背景,以仅 2.323 亿美元风险投资实现美股 IPO,市值突破 50 亿美元大关。

并购方面,英伟达宣布收购 Run:ai,预示 AI 硬件加速领域整合加速,BirchAl、Claypot AI、Inflection AI 等企业亦被并购。PitchBook 预测,Cerebras 或将成为下一个 IPO 的 AI 芯片巨头,并持续推荐数据独角兽 Databricks,后者新推 DBRX 开源大型语言模型竞争 GPT-3.5 等,估值已超 380 亿美元。

马斯克的 xAI 获 60 亿美元融资,Meta 主管 LeCun 愤然开炮

近日,埃隆·马斯克(Elon Musk)创立的 xAI 公司宣布完成 60 亿美元巨额 B 轮融资,公司估值达 180 亿美元。此轮融资由多家知名风投机构参投,标志着马斯克在与 OpenAI、Anthropic、谷歌等公司的通用人工智能(AGI)竞争中采取攻势,特别是借助其 Grok 系列模型及聊天机器人。马斯克虽与 OpenAI 理念不合分道扬镳,却在 xAI 项目中加速推进;伴随资金注入,xAI 拟加大 GPU 集群建设和人才招聘,直接挑战 OpenAI 的 ChatGPT 和谷歌的 Gemini,同时透露计划于 2025 年前建成超级计算机,规模或为当前最大 GPU 集群的四倍。此番动作加剧了 AI 领域的基础设施竞赛。

与此同时,马斯克与 AI 领域先驱 Yann LeCun 就 AI 的安全监管问题在社交媒体 X 上展开公开讨论,两人截然不同的立场凸显了业界对 AI 未来发展监管路径的深刻分歧:

LeCun 表示,现在忧虑 AI 带来“生存风险”并急于监管还为时尚早。他认为,人工智能的安全性在于人类的设计与控制,并以涡轮喷气发动机为例,指出在确保高度可靠性后才广泛部署,AI 亦应遵循类似路径。LeCun 重申了他的“开放而非监管”立场,倡导开源和共享以促进技术的透明度与安全性。

而马斯克则以他特有的幽默风格回应:“Prepare to be regulated”(准备接受监管),暗示监管的必要性。作为一位积极的监管支持者,马斯克虽然对 AI 失控持有深切忧虑,但他并未放慢建立个人 AI 帝国的步伐。他强调,尽管监管“并不有趣”,但在 AI 可能“掌控一切”之前建立规则至关重要。随后,这场骂战逐渐上升到人身攻击的层次,火药味颇重。

中国 AI 辅导应用席卷美国市场

随着 ChatGPT 等大型语言模型的兴起,一批 AI 辅导应用程序正悄悄改变美国学生的学习方式,Answer AI、Question AI、Gauth 等应用如今已成为众多美国学生解决学业难题的新宠。Data.ai 数据显示,美国教育 App 市场中,五分之一的头部应用是专注于作业辅助的 AI 工具,其中 Answer AI、Question AI 等凭借庞大的题库资源与精准的 AI 算法,下载量分别达到 600 万次和 1200 万次。

这些应用背后的中国公司,如作业帮与字节跳动,正利用在中国市场积累的海量教育数据优势,通过不断优化的大型语言模型,提供更加精准和个性化的学习体验。Answer AI 的创始人 Ric Zhou 近日接受媒体采访,强调了 AI 辅导超越传统教育模式的潜力。他指出,AI 不仅极大地促进了教育资源的平等获取,还实现了前所未有的个性化教学体验,这在传统班级授课模式中难以实现。AI 通过学习学生习惯,提供定制化反馈,成为每个学生专属的“永不疲惫的私人教师”。同时,他透露 Answer AI 正不断探索如何通过技术升级,如“检索增强生成”(RAG)策略,进一步提升解答的准确性和教学互动性,引导学生主动探究而非简单抄袭答案。

苹果将为 Safari 浏览器增加 AI 功能

据 Appleinsider 报道,苹果正在测试全新版本的 Safari 功能,并将在其中增加一系列的 AI 功能。据悉,苹果将会为新版本的 Safari 浏览器带来全新的用户界面和一系列新功能,包括网页橡皮擦和内容摘要等等。新 UI 中包含全新的页面控制菜单,该菜单整合了新旧页面控制工具并提供快速访问,其中包括浏览器的新“智能搜索”功能。一旦启用,该工具将利用苹果设备上的人工智能技术(特别是 Ajax 语言学习模型)来识别网页中的主题和关键短语,并以此为基础进行总结。

Stability AI 推出文生图聊天机器人 Stable Assistant

据 Statbility AI 官方消息,旗下文生图聊天机器人 Stable Assistant 现已开始测试,将会在不久后开放。Stable Assistant 搭载 Stable Diffusion 3 和 Stable LM212B 等多款文生图模型,可根据用户需求生成不同图片。Stable Assistant 具备出色的多主题提示、图像质量和拼写能力它擅长根据对话提示生成图像、提供知识性回答、帮助写作项目,并用匹配的图像增强内容。

清华大学革新 YOLOv10 登 GitHub 热榜

近日在计算机视觉领域,清华大学接过 YOLO(You Only Look Once)系列的火炬,发布 YOLOv10,革新了实时目标检测技术的效能标准,引发 AI 界广泛关注。YOLOv10 的发布标志着目标检测技术的一个重要里程碑,清华大学的研究团队通过对 YOLO 系列的深度优化,成功打破了以往的性能和效率边界。这项新技术不仅提升了实时目标检测的精度,还显著降低了推理延迟,解决了长期以来依赖非极大值抑制(NMS)后处理带来的效率瓶颈,实现了端到端的高效部署。

通过引入创新的一致双重分配策略,YOLOv10 在训练阶段同时采用一对多和一对一的标签分配方式,既保证了丰富的监督信号促进了模型的优化和性能提升,又确保了在推理时无需 NMS,从而减少了部署成本。这种新颖的训练方法不仅维持了高准确率,还提高了模型的运行效率。

此外,研究团队采取了整体效率-准确率驱动的模型设计策略,对 YOLO 架构中的多个组件进行了重新设计和优化,比如轻量级分类头、空间通道解耦下采样和排序指导的模块设计,这些改进有效减少了计算冗余,增强了模型能力。同时,通过引入大核卷积和部分自注意力(PSA)模块,进一步在较低的计算成本下提升了模型的识别能力。

实验结果显示,YOLOv10 在 COCO 数据集上达到了最先进的性能表现,且在不同的模型尺寸上都展现出了优越的性能效率比。例如,YOLOv10-S 相较于其他实时检测器如 RT-DETR-R18,在相近的平均精度(AP)下,推理速度提高了 1.8 倍,且参数量和浮点运算量(FLOP)显著减少。与前代 YOLOv9 相比,YOLOv10-B 在保持相似性能的同时,延迟降低了 46%,参数量减少了 25%。

论文链接:https://arxiv.org/pdf/2405.14458

开源项目链接:https://github.com/THU-MIG/yolov10

清华大学携手华为诺亚方舟实验室打造 iVideoGPT

随着生成模型在人工智能领域的飞速发展,视频生成技术正引领新的科研前沿。清华大学、华为诺亚方舟实验室与天津大学的研究团队近期推出 iVideoGPT,这是一个创新的交互式自回归 Transformer 架构,旨在为世界模型带来革命性的交互性与扩展性。iVideoGPT 通过整合视觉观察、动作及奖励等多模态信号至一系列 token 中,使智能体能够通过预测下一个 token 进行交互体验,从而学习。

iVideoGPT 的核心在于其新颖的压缩 tokenizer 与自回归 Transformer 架构,能够在多样化的视频数据上预训练,获取世界运行原理的广博学识,并高效迁移至下游任务。实验表明,与 SOTA 模型相比,iVideoGPT 在保证了竞争力的同时,展现了交互性和扩展性的良好平衡,甚至在低分辨率下也能轻松扩展至更高清度,展示出零样本泛化至未见数据集的潜力。

研究团队独创的压缩 tokenization 技术解决了高维视觉信息的离散化难题,自回归 Transformer 则确保了模型能够在未来 token 的生成中维持上下文一致性。iVideoGPT 在包含百万类别的机器人操作轨迹上进行了大规模预训练,为多种下游任务奠定了多功能的交互式世界模型基础,推动了通用世界模型研究的前沿发展。

论文链接:https://arxiv.org/pdf/2405.15223

f4322b0ff2709e3a55c5025e2a3f05f6.gif

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料(案例)的内容原则,将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题:大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉:http://sdcon.com.cn/

c1dc10934ca7c90e03797da3ff86680c.jpeg



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。