奥特曼：AI模型能解决所有物理问题；开源模型排行全体重测，中国Qwen2卫冕冠军

奥特曼：AI模型能解决所有物理问题；开源模型排行全体重测，中国Qwen2卫冕冠军 | AI头条

AI科技大本营 2024-07-01 14:01:02 阅读 52

整理 | 王启隆

出品 | AI 科技大本营（ID：rgznai100）

一分钟速览新闻点！

Sam Altman：我们能让 AI 模型解决所有物理问题

人工智能对小企业影响有限：只有 5% 的美国企业正在使用 AI

Hugging Face 推出新版开源大模型排行榜，中国模型 Qwen-72B 夺冠

人工智能作弊横行，研究发现大学居家考试中 94% 的 AI 答案未被发现

微信输入法重磅更新：上线“一键 AI 问答”

联想集团发布多款 AI PC，支持 24 小时续航、多模态创作

商汤科技将发布「日日新 5.5」大模型，全面升级产品矩阵

Figma 推新 AI 功能，一键生成创意设计初稿

亚马逊市值首次突破 2 万亿美元，AI 狂潮与降息预期助推涨势

虚拟体育主播「上岗」，美国 NBC 广播公司将在巴黎奥运会期间启用 AI 解说

全球 AI 要闻

Sam Altman：我们能让 AI 模型解决所有物理问题

在第 20 届 Aspen Ideas Festival 上，OpenAI 首席执行官 Sam Altman 与 Airbnb 首席执行官 Brian Chesky 接受 NBC 新闻主播 Lester Holt 访谈，共同探讨人工智能（AI）的未来前景及潜在挑战。两位受访者 Altman 与 Chesky 的深厚友谊源于 Y Combinator 创业加速器，Chesky 在去年 Altman 遭解雇后的那场“宫斗风波”提供了巨大帮助。

Altman 说，AI 工具将塑造人类集体生活的未来，他相信随着 AI 模型超越现有知识训练的局限，其发展路径将更加多样化。他强调，AI 并非单纯依赖数据量的增长，而是会探索新的构建方式，类似于农业革命或工业时代的机器发明对社会的影响。此外，他认为我们正接近一个时代，届时我们可以要求一个人工智能模型解决所有物理学问题，而它真的能够做到。

Altman 乐观地表示，从 ChatGPT 问世前至今，个人能力已实现显著飞跃，预计至 GPT-6 或 GPT-7 时，个体能力将得到极大提升，这将推动世界向更好的方向发展。然而，创意行业工作者对 AI 进步持谨慎态度，担心版权侵犯及 AI 生成的深度伪造等虚假信息泛滥，监管缺失成为一大隐患。

Altman 承认 AI 被用于不良目的的可能性不可避免，特别是在即将到来的选举中，深度伪造可能成为焦点。此外，OpenAI 的 Sky 语音助手因声音类似演员 Scarlett Johansson 而引发争议，但公司坚称这是另一名演员的自然声音。Altman 表示，若该演员愿意，公司将支持她公开澄清。

人工智能对小企业影响有限：只有 5% 的美国企业正在使用 AI

一项由工作场所消息应用 Slack 发布的最新 Workforce Index 报告指出，对人工智能（AI）的信任缺失可能是小型企业采用AI的主要障碍。据调查，在美国，仅 7% 的办公桌工作者认为 AI 的回答完全可信，而隐私、数据质量和准确性是阻碍他们尝试 AI 技术的三大因素。

AI 在小型企业中的影响至今有限。美国人口普查局 6 月的调查显示，仅有 5% 的美国企业正在使用 AI 技术。尽管 96% 的受访高管表示感受到将 AI 引入业务的压力，且优先级高于通胀和经济问题，但约 68% 的员工并未在工作中使用 AI。尽管整体使用率低，但自去年 9 月以来，美国使用 AI 的办公桌工作者比例增长了近 80%，表明人们正在逐渐探索 AI 的应用，尤其是那些已经使用AI的人，在生产力、抗压能力和工作满意度上分别提高了 3%、5% 和 6%。

Hugging Face 推出新版开源大模型排行榜，中国模型 Qwen-72B 夺冠

Hugging Face 创始人兼 CEO Clem Delangue 近日在 Twitter（X）上宣布，该公司已使用 300 张 H100 显卡，对所有主流开源语言模型进行了最新一轮评测，其中包括 MMLU-pro 等基准测评。在此次评测中，中国开源模型 Qwen-72B 仍旧脱颖而出，整体上中国开源模型占据了主导地位。

Clem 指出，之前的评估标准对于当前的先进模型而言过于简单，犹如用初中试题去衡量高中生的能力，这暗示了 AI 开发者们开始过分关注主要的评估指标，以至于在其他方面牺牲了模型的表现。他强调，更大的模型并不总是更聪明，模型性能的提升似乎正在达到平台期。

为了应对这一挑战，Hugging Face 团队决定升级其开源语言模型排行榜至 v2 版本。在过去的一年里，排行榜已成为机器学习社区内外广泛使用的资源，吸引了超过 200 万独立访客，每月约有 30 万名社区成员通过提交和讨论参与其中。排行榜 v2 旨在提供一个更加公平、透明的评估环境，帮助研究者们找到真正的前沿进展，同时也能让模型开发者们客观地评价自己的工作，与现有最佳模型进行比较，获得公众认可。

人工智能作弊横行，研究发现大学居家考试中 94% 的 AI 答案未被发现

雷丁大学的最新研究显示，人工智能在大学考试中的潜在作弊行为严重威胁到教育评估的公正性。研究人员将完全由人工智能生成的答案提交到雷丁大学心理学本科课程的居家考试中，结果显示，仅有 6% 的 AI 生成答案被识别出来，而这些 AI 答案的平均得分竟比真人学生高出半个等级。研究团队在五个本科心理学课程中注入了完全由 AI 生成的答案，结果发现，94% 的 AI 答案未被检测到，且 AI 答案的平均成绩比真实学生高出半个等级。在各个课程中，AI 答案优于随机选择的同数量真实学生答案的概率高达 83.4%。

论文标题：A real-world test of artificial intelligence infiltration of a university examinations system: A “Turing Test” case study

微信输入法重磅更新：上线“一键 AI 问答”

功能微信官方宣布，微信输入法正式上线“一键 AI 问答”功能。据悉，该功能基于腾讯混元大模型。只需在微信内聊天框中输入内容后加一个符号“=”，即可获取 AI 回答。点击右下角“复制为图片”提示自动生成图片，可保存使用。官方表示，目前 Win 端、Mac 端均已上线，移动端也在路上了。

联想集团发布多款 AI PC，支持 24 小时续航、多模态创作

联想推出三款 AI PC，包括 YOGA Air 14s 骁龙 AI 元启、YOGA Air 14c AI 元启和拯救者 Y9000P AI 元启，搭载高通骁龙 X Elite 平台，具备强大 NPU 算力和多模态功能，旨在提升办公和创作效率，并实现全场景无缝连接的 AI 体验。

商汤科技将发布「日日新 5.5」大模型，全面升级产品矩阵

商汤科技将在世界人工智能大会（WAIC 2024）期间发布“日日新 5.5”版本，全面升级“云、端、边”大模型产品矩阵，“日日新 5.5”大模型体系的多模态能力将大幅升级，同时进行多项合作签约。此前，商汤在今年推出的“日日新 5.0”大模型体系，其多模态图文感知能力、文生图能力就已经达到全球领先水平。据介绍，“日日新 5.5”将进一步展现强大的混合模态能力，模态跨度也将不仅限于图文，同时多模态能力也将加持长文档等多项功能。

Figma 推新 AI 功能，一键生成创意设计初稿

在 Config 2024 大会上，Figma 宣布了一系列重大更新与新功能，着重于 AI 技术的应用，旨在提升设计效率与创意空间。Figma AI 的引入，标志着设计流程的革新，它能够帮助用户快速定位所需资源，自动生成设计草图，以及自动化重复性工作，使设计师能更专注在创意与策略上。此外，Figma 推出了 Figma Slides 工具，实现一站式 PPT 创作与演示，无需再进行繁琐的导出与导入操作，当前处于免费测试期。

亚马逊市值首次突破 2 万亿美元，AI 狂潮与降息预期助推涨势

电子商务和云计算巨头亚马逊股价升至纪录高位，加入了市值不低于 2 万亿美元的公司行列。该股周三盘中一度上涨 3.2%，至 192.33 美元，市值突破 2 万亿美元。该股今年上涨了约 27%，由于人工智能推动其云计算业务再度加速，公司增长趋势改善。亚马逊由此跻身 2 万亿美元市值俱乐部；Alphabet（谷歌母公司）在 4 月突破这一大关，而英伟达、微软和苹果的市值均超 3 万亿美元。

虚拟体育主播「上岗」，美国 NBC 广播公司将在巴黎奥运会期间启用 AI 解说

NBC 宣布将通过电视和流媒体平台报道奥运会，并使用 AI 生成语音进行解说。Peacock 流媒体平台将提供奥运集锦，预计生成近 700 万个个性化视频，由 AI 主播模拟阿尔・迈克尔斯的声音解说。

上一篇： Questflow借助MongoDB Atlas以AI重新定义未来工作方式

下一篇： PyTorch报错shape ‘[16, 1, 28, 28]‘ is invalid for input of size 6272?尝试设置-1

本文标签

中国Qwen2卫冕冠军 | AI头条奥特曼：AI模型能解决所有物理问题；开源模型排行全体重测

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。