Claude模型将接入亚马逊Alexa;ChatGPT周活跃用户超过2亿 | AI头条
AI科技大本营 2024-09-08 14:31:02 阅读 66
整理 | 王启隆
出品 | AI 科技大本营(ID:rgznai100)
一分钟速览新闻点!
Claude AI 将接入亚马逊 Alexa 语音助手
ChatGPT 周活跃用户超过 2 亿
无问芯穹完成近 5 亿元 A 轮融资,致力于成为大模型时代算力运营商
微软 AutoGen Studio:低代码构建多代理复杂系统的利器
1X 推出家庭人形机器人 NEO Beta
OpenAI 或将推出新一代 AI 模型 “草莓”,提升推理能力引关注
Magic 推出超长期上下文模型 LTM-2-mini 及创新评估方法
阿里开源 Qwen2-VL:强大的多模态视觉语言模型
AI 员工 Bland 亮相,公司获 2200 万美元 A 轮融资
国内外 AI 要闻
Claude AI 将接入亚马逊 Alexa 语音助手
据路透社消息,亚马逊 Alexa 计划在 10 月主要由 Anthropic 的 Claude 人工智能模型提供动力。这一举措带来巨大影响,成为 OpenAI 旗下 ChatGPT 产品的 Advanced Voice Mode 功能和谷歌旗下的 Gemini Live 的强大竞争对手。
此前,OpenAI 与苹果合作在苹果设备上接入,如今 Anthropic 也可能在亚马逊语音助手 Alexa 上接入。目前在移动设备上发展和体验较好的是谷歌的 Gemini live,用户可在系统级层面使用。由于 Alexa 拥有巨大的潜在市场,此次接入 Claude AI 可谓是竞争激烈。
ChatGPT 周活跃用户超过 2 亿
OpenAI 透露 ChatGPT 周活跃用户突破了 2 亿,两倍于去年的数字。OpenAI 表示,92% 的财富 500 强企业在使用其产品,自 7 月发布 GPT-4o mini 以来,自动化的 API 使用量翻倍。CEO Sam Altman 在一份声明中表示,该公司的工具已成为日常生活的一部分,在医疗保健和教育等领域发挥着真正的作用。
无问芯穹完成近 5 亿元 A 轮融资,致力于成为大模型时代算力运营商
2024 年 9 月 2 日,无问芯穹宣布完成近 5 亿元 A 轮融资,成立短短 1 年 4 个月累计融资近 10 亿元。本轮融资由社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投和洪泰基金联合领投,众多战略投资方和财务机构跟投。过往投资方也包括众多知名投资机构。
此次融资资金将用于吸纳技术人才、研发技术、推动产品商业化、强化生态合作等,致力于成为大模型时代首选的“算力运营商”。
无问芯穹联合创始人、CEO 夏立雪表示,公司凭借软硬协同、多元异构技术优势,以及源于清华电子系的深厚底蕴和产研结合的团队,在 AI 2.0 浪潮中迎来机遇。公司通过软硬件联合优化技术提升芯片算力利用率,如自研推理加速技术 FlashDecoding++在多个主流开源大模型上完成适配,并与 AMD 签署战略合作。在多元异构算力适配方面,其大规模异构分布式混合训练系统 HETHUB 实现千卡规模异构算力混合训练,集群算力利用率高。
无问芯穹打造的 Infini-AI 异构云平台向下兼容多元异构算力芯片,包含一站式 AI 平台和大模型服务平台,已有多个大模型行业头部客户使用。无问芯穹目标是降低大模型落地成本,成为行业触手可及的新质生产力,加速 AGI 的普惠进程。君联资本、启明创投、洪泰基金等投资方代表也对无问芯穹给予高度评价。
微软 AutoGen Studio:低代码构建多代理复杂系统的利器
微软研究院近日开发的 AutoGen Studio 是一款低代码工具,目标是助力开发者快速构建和评估由多个人工智能代理组成的复杂系统。它具有可视化界面,可定义和整合组件以形成智能体工作流,降低开发门槛和减少开发时间精力。主要功能包括低代码开发环境、多代理对话框架、可重用代理组件、性能监控和调优、工作流部署测试导出以及多种 API 接口等。该工具下载超 20 万次,被用户评价实用,通过用户反馈不断迭代更新,有成功案例。其系统设计分为前端用户界面(含构建视图、游乐场视图、画廊视图)和后端 API(含 Web API、Python API、命令行接口)。目前正在积极开发,快速迭代。
论文:https://arxiv.org/abs/2408.15247
GitHub:https://github.com/microsoft/autogen/tree/main/samples/apps/autogen-studio
1X 推出家庭人形机器人 NEO Beta
近日,机器人创业公司 1X 推出专为家庭使用的双足人形机器人 NEO Beta。该机器人身高约 1 米 65,体重 30 公斤,步行速度 1.12 m/s,跑步速度 3.35 m/s,可承重 20 公斤,运行时间 2 到 4 小时。NEO Beta 专为做家务设计,能完成高难度动作,干活时可以保持静音,靠眼神交汇和手势比划沟通,主打情感陪伴。
1X 公司 2014 年创立,原名 Halodi Robotics,2022 年与 OpenAI 合作,2024 年 1 月 B 轮融资 1 亿美元。NEO Beta 建立在公司早期轮式人形机器人 EVE 的经验之上,采用类似人类肌肉组织的结构设计,安全且能适应复杂真实环境,在多个行业的工业任务中表现出色,能理解环境和处理易碎物品,实现人机无缝协作和沉浸式互动。1X 公司致力于创建通用家庭机器人,解决物理智能问题,专注安全性,为消费者提供实用易用产品。
OpenAI 或将推出新一代 AI 模型 “草莓”,提升推理能力引关注
据传,Sam Altman 的 OpenAI 经过数月研发,即将推出新的人工智能模型 “草莓”。该模型有望大幅提升热门聊天机器人 ChatGPT 的数学和推理能力,预计今年秋季推出,可能作为独立聊天机器人发布,也可能融入现有 ChatGPT 平台。“草莓” 因传闻能解决复杂数学和推理难题备受关注,当前多数 AI 模型在处理陌生问题时存在困难,而 “草莓” 可能克服这些挑战,是 AI 技术的重大进步,但模型架构和参数等具体细节尚不清楚。
Magic 推出超长期上下文模型 LTM-2-mini 及创新评估方法
近日,Magic 公司发布了具有 100M Token 上下文的模型 LTM-2-mini,100M Token 相当于约 1000 万行代码或约 750 本小说。LTM 模型训练为能在推理时处理高达 100M token 的上下文信息,而非依赖模糊记忆。
现有的长上下文评估方法存在问题,如隐含语义提示降低评估难度,使 RNN 和 SSM 等模型能获好评分。为此,Magic 团队提出 HashHop 评估方法,通过哈希对要求模型存储和检索最大信息量,提高评估准确性。
LTM-2-mini 模型在处理超长上下文时,其序列维度算法成本远低于 Llama 3.1 405B 模型的注意力机制。此外,该模型在文本到差异数据训练上有一定成果,如在自定义上下文图形用户界面框架方面,能创建计算器和实现密码强度计等。Magic 还与 Google Cloud 合作建设超级计算机,并获得新的资金投入,同时进行团队扩充和招聘。公司重视 AI 安全和监管,认为先进的 AI 应如核工业一样对待。
阿里开源 Qwen2-VL:强大的多模态视觉语言模型
阿里开源了多模态视觉语言模型 Qwen2-VL,国内目前缺乏优秀的支持视频理解的多模态闭源模型,而 Qwen2-VL 基于 Qwen2 打造,虽最大的 Qwen2-VL 72B 未开源,但 2B 和 7B 规模的模型已开源。
Qwen2-VL 相比 Qwen-VL 有诸多特点,在 MathVista、DocVQA、RealWorldQA、MTVQA 等视觉理解基准测试中表现领先,能读懂不同分辨率和长宽比的图片,可理解 20 分钟以上长视频用于问答、对话和内容创作等,能作为视觉智能体操作手机和机器人,还支持多种语言包括大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。
在模型架构上,实现了对原生动态分辨率的全面支持,能处理任意分辨率图像输入,不同大小图片转换为动态数量 tokens,最小仅占 4 个 tokens;同时创新采用多模态旋转位置嵌入(M - ROPE),可同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息。
AI 员工 Bland 亮相,公司获 2200 万美元 A 轮融资
Bland.ai 公司于近日完成 A 轮 2200 万美元融资后,正式推出新型 AI 员工 Bland。Bland 是一款可定制的电话呼叫代理,能够以任何语言和声音交流,可针对任何用例进行设计,能同时 24/7 处理数百万个电话且不会产生幻觉。不过,有人对其可能带来更多垃圾和诈骗电话表示担忧,也有人认为这是违背特定指示的产品。
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。