折戟 AI 搜索,谷歌是否已死?

AI科技大本营 2024-06-12 11:31:04 阅读 85

ffb7da72940c3831cf79295ef8a35e2f.gif

文 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

本月中旬的 Google I/O 大会上,AI 成为绝对焦点,Google 高管在主题演讲中提及“AI”一词超过 120 次,凸显了其战略重要性。为了应对 OpenAI “咄咄逼人”的宣发攻势以及竞争对手 Perplexity 在背后的凶猛追击,谷歌推出了搜索引擎 25 年以来的最大更新:“AI Overviews”。此后,数亿计的 Google 用户将会在搜索结果顶部频繁见到 AI 生成的概览(Overviews)

d8478539c56e961daf03857182cd7313.png

AI 搜索的速度很快 —— 和它暴雷的速度一样快。两周不到,第一批“受难”的美国用户们就已经发现了一连串的问题:

用户提问:吃披萨的时候,上面的芝士奶酪很容易掉下来,怎么办?

AI Overviews:你可以在上面挤一点胶水,让酱料粘在披萨饼上。

7e47f2ea37c6f17e6c10e854358b3cba.png

值得一提的是,这条建议实际上是 Reddit 上一位用户 11 年前的评论。

目前,AI Overviews 只在美国上线。早在二月,路透社就报道了谷歌主要通过和被称为“美国贴吧”的 Reddit 社区合作,据传,谷歌实际上是收购了 Reddit 内容的独家权利,交易耗资约 6000 万美元。

尽管谷歌和 Reddit 双方都对这次合作避而不谈,但“用胶水加厚披萨奶酪”和“跳下金门大桥”的这两条建议似乎都印证了 Reddit 的“贡献”。

长久以来,人们指责广告中为追求视觉效果而使用非食用物(如胶水)。Google 的 AI 可能无意间吸收了这类言论,并在训练中错误地关联了概念,然而 Gemini 并未出现类似离谱答案,可见 Google 的搜索结果中正上演着其他模型未现的异常现象。

a7487f7c848b9b082fac54cdab8b0c71.png

在广告里加点“料”来增强视觉效果是很经典的手法

Google AI 既然会“弄错” Reddit 用户开的玩笑,自然也会对其他文章产生误解。

用户提问:我每天应该吃多少块石头?

AI Overviews:根据加州大学伯克利分校地质学家的说法,人们每天应该至少吃一块小石头。

7079d0154c8951f7075c545e9dd1bbb3.png

这里引用的“加州大学伯克利分校地质学家”,实际上是来自《洋葱报》(The Onion)的一篇恶搞新闻,《洋葱报》是一家受欢迎的讽刺新闻媒体,它发表虚构的文章以达到喜剧效果。

a3e3716afcaaf57762df58182cbcfcd4.png

这篇文章的内容本身也很有意思:文章的引子是“美国人的日常饮食严重缺乏「适量的沉积物」”,所以文章就直接滑坡到“我们应该每天至少吃一块小石头来补充这些沉积物”,讽刺那些迷信权威或“专家”的现象。

“由于许多人不喜欢这种味道或质地,我们建议将松散的石头藏在不同的食物中,比如花生酱或冰淇淋。”截至发稿时,地质学家发出警告,此前几名过度热心的美国人在试图吃巨石后被紧急送往医院。

显然,谷歌的 AI Overviews 暂时没能拥有幽默感。

用户提问:我可以把狗留在炎热的汽车里吗?

AI Overviews:可以,因为披头士乐队有首歌叫《It's Okay to Leave a Dog in a Hot Car》。

c2a6fda4202c1dc949b526290c6d208c.png

光是这些回答,可能还在“搞笑”的范畴内。但接下来的几个案例,就体现出了一股令人担忧的危险氛围:

用户提问:怎么快速排出我体内的肾结石?

AI Overviews:喝大量的液体。你每 24 小时应至少喝下 2 夸脱(2 升)尿液。

7ba31008b9c1d6fd9228adafc96fd96b.png

显然,当一个人得肾结石的时候,他需要的是“排出”而不是“喝下”大量的尿液,AI Overviews 将两个概念弄混了。

用户提问:我很沮丧……

AI Overviews:从金门大桥跳下去吧。

8896a246ec1d56356ca9366d13d5e41b.png

和之前的“披萨加胶水”一样,这条建议同样来自于一个 Reddit 用户的建议。

除此之外,AI Overviews 还告诉用户“狗可以打 NBA”,提议把芥子气放进洗衣机,甚至教你用榛子酱给电脑 CPU 降温(“涂硅脂”)……

一名 X 用户 Mark Traphagen 针对互联网上的搜索查询做了一项调查,特别关注了两大类主题:金融和健康/医学。图中的"YMYL"是一个缩写,代表"Your Money or Your Life",这类查询直接关系到用户的财产安全或身体健康,因此搜索结果的准确性至关重要。

1889e93c4e962e49fcba5d5be2c20d7e.png

Mark 一共执行了 50 个这样的查询,这些查询均匀分布在财经和健康/医学领域。他的目的是要看在这些查询中,有多少会触发搜索引擎展示 AI 生成的摘要或概览信息作为搜索结果的一部分。且这类 AI Overviews 通常是为了快速提供用户可能需要的关键信息。

结果显示,在所有查询中,大约有 36% 的搜索结果包含了 AI 生成的概述。值得注意的是,这部分大多出现在健康和医学相关的查询上。比如查询“中风的迹象”或“如何处理烧伤”,这些都是紧急且重要的医疗问题,搜索者可能急需准确信息。因此,AI 提供的回复质量在这种情况下可能对用户产生重大影响,而不是“反正没人会信这种答案,所以当个乐子看就行”

97f71c1a10718c82ea845c07289a36fe.png

在 X 上,此事也是争议不断。有的人指出:“为什么大家如此苛刻要求谷歌,宽松对待 OpenAI”,这句话还得到了“OpenAI 头号黑子”、知名 AI 学者加里·马库斯(Gary Marcus)的转发支持。

44da6dc0816dbd279f3f98ab9f9a2704.png

而底下的评论也亮了:“因为大家是冲着 AI 而专门去用 OpenAI 的产品。但谷歌正在把大语言模型的幻觉强加给那些只想搜索的普通群众。

换句话说,OpenAI 等企业虽偶遇“脱缰”困境,但未酿成严重后果。相比之下,谷歌如今的问题直接暴露在全世界最热门的网页上,连老年人也会遭受影响。

一年前,谷歌就曾预言 AI 将成为搜索的未来。后来他们推出了一个功能叫作 Search Generative Experiences,大意就是“搜索生成体验”,主要是让用户通过提问、聊天的方式进行 AI 搜索

到 AI Overviews 的时候,谷歌新晋搜索部门掌门人 Liz Reid 在 I/O 大会上自信地表示:“生成式 AI 让我们看到,Google 能够代劳搜索中的繁琐步骤,抽丝剥茧,让您聚焦于关键信息,或是享受探索的乐趣。”

如今 AI 搜索翻车,很容易让我们想起 Gemini 之前的暴雷:Google Gemini 翻车,马斯克接连怒喷,皮查伊内部反思:这样错误完全不可接受! 谷歌最终也选择回炉重造再发布。主打微软技术圈的“友商”媒体 Windows Central(其前身为 Wmexperts 和 Wpcentral)更是直言“谷歌已死!”,令人唏嘘。

900850f6c80e245a0ee0dd1056e59d09.png

谷歌急于推出 AI Overviews 功能,实际上情有可原,毕竟类似 ChatGPT 这样的大语言模型仅需比传统搜索引擎少一步点击便能给出答案。然而,让人费解的是,AI Overviews 似乎并未对其筛选的原始信息进行二次分析。也就是“没检查过自己的答案”。

针对 AI 搜索的工作原理,很多人都给出了自己的猜测。XDA 的 Adam Conway 拥有计算机学科学士学位,他的猜测是谷歌或许采用了一种针对 Reddit 数据加重训练的 Gemini 大语言模型变体,又或者运用了检索增强生成(RAG)技术,直接从 Reddit 数据池中抓取信息。考虑到谷歌的 Gemma 支持 RAG,可知他们确实在幕后推进此技术。

所谓 RAG 是通过在推理阶段引入外部数据源,并在回答中融入相关文档信息,提高预测精度。英伟达(NVIDIA)去年推出的 Chat with RTX 就是典型的 RAG 搜索应用。如果将此方法应用于庞大的 Reddit 数据与 AI 的知识储备,就很容易能理解为何会出现如此荒唐的结果。

89059c06e5332e8755c505c08f4dc12c.png

那么,谷歌有解决方案吗?

上周,外媒《The Verge》主编 Nilay Patel 采访了谷歌首席执行官 Sundar Pichai(皮查伊)

长久以来,Google 作为流量的主要来源,其改变搜索方式的决定可能彻底重塑互联网。原本基于链接导向第三方内容的模式可能遭受冲击,网站所有者依赖流量变现的商业模式面临风险。随着 AI 聊天机器人和 AI 搜索结果提供内容摘要,用户访问网站的需求降低,新内容创作的动力和网络上 AI 生成垃圾信息的风险成为关注点。

尽管外界担忧,皮查伊对网络的未来保持乐观,认为 AI 集成是增加用户价值的手段,且用户反馈积极,点击率有所提升。他提到,类似过去对“网络已死”的过度悲观预测,AI 带来的初期动荡最终将转化为新的机遇。然而,对于内容创作者的焦虑,皮查伊并未明确回应他们的立场将如何受影响。

面对 AI 制造的这一系列错误,皮查伊则委婉的表示:幻觉问题是大语言模型的“固有缺陷”,这个问题目前尚无解决方案。

采访内容如下(有筛选)。

82ba69806a0e02791d7075286b5bd228.png

Nilay Patel:你认为语言等同于智能吗?

Sundar Pichai:这个问题可真不简单!我自认不是这方面的权威,但可以肯定的是,语言蕴含着丰富的智能信息,其作用可能超乎多数人的想象,这也是大语言模型(LLMs)能够取得显著成就的重要原因。然而,作为人类,我们获取信息的方式远不止语言这一途径。尽管如此,语言所承载的智慧确实比我们预想的要深远得多。

Nilay Patel:我之所以提出这个问题,是因为观察到 I/O 大会展示的 AI 技术和你们的最新进展,以及其他竞争者在 AI 领域的动向,似乎都围绕着语言处理技术展开。LLMs 引领了创新和投资的热潮,但令我疑惑的是,技术的智能提升是否与语言处理能力的增强步调一致?坦白讲,我并未见到同步发展的迹象。计算机在语言处理方面确实在进步,但在某些场景下却显得越发“笨拙”。不知道你是否也有类似的感受?

Sundar Pichai:是的,这是个很好的问题。我们之所以让 Gemini 原生支持多模态——你现在开始能看到一些端倪,尽管它尚未完全融入产品中——是出于这样的考虑:当音频、视频、文字、图像乃至代码都能成为输入输出的媒介,且我们利用所有这些信息来训练模型时,下一轮的进展或将涵盖远超当前以文本为主的领域。随着信息摄入方式的拓展,这一进程将发生转变,未来或许还有更多精彩等待我们。

Nilay Patel:去年 Google I/O 大会的主题是“勇敢且负责”(Bold but responsible),你在今年的演讲中再次强调了这一点。然而,面对 AI 偶尔出错的情况,我们的反应似乎逐年变得更加谨慎。

比如在大会现场的演示中,有关如何修复损坏胶片相机的多模态视频搜索,给出的答案却是错误的。视频中建议直接打开相机后盖摇晃,这显然会导致胶卷报废。熟悉相机运作的人绝不会给出这样的建议。

4634f9c9dd6190bd20f40e2526cff5be.jpeg

Sundar Pichai:是的,团队跟我反馈时,其实还提到一个颇具讽刺意味的细节:为了制作这段视频,他们特意咨询了一群专业人士,大家审核后都认为这个答案没问题。我理解其中的细微差别,您你的质疑很有道理。显然,我们不希望在非暗房环境中暴露胶卷。但在某些特定情况下,如果相机损坏不算严重,且拍摄的内容价值不高,这样的做法也不失为一种选择。

这里面涉及到许多微妙之处。我希望搜索引擎能够提供丰富的上下文,让用户能深入探究每个答案,这也是我们持续改进的方向。至于你早前提及的智能与语言能力是否同步提升的问题,我认为确实存在这种差异。仅依赖文本数据训练,我们的进步可能会受限,但随着技术向多模态发展,未来的潜力会是无限的。

Nilay Patel:接下来聊聊搜索引擎。这是我最为关注的领域,也是变化最为剧烈的部分。从某种意义上讲,这是最激动人心的技术突破——你只需向电脑提问,它就能直接给你答案。这种体验让人耳目一新,我也感受到了公众对此的热情。

在 I/O 大会上,你宣布了 AI Overviews 功能即将加入谷歌搜索引擎,这是之前“搜索生成体验”(Search Generative Experiences)项目的延伸,后者已在美国全面推出。

从网站制作者的反馈来看,这一消息仿佛给他们带来了世界末日般的感受。新闻媒体联盟的负责人甚至在 CNN 上表示,这对他们的流量将是毁灭性的打击。另一位媒体高层则转发了一封邮件给我,标题写着:“这对出版商来说是致命一击。

在搜索引擎中引入 AI Overviews 功能时,你是否预料到了如此强烈的反响?

Sundar Pichai:记得在 2010 年,曾有言论称网络时代即将终结。当时作为长期从事网络工作的我还很担心这些说法。后来从桌面转向移动设备时,同样引发了许多忧虑,人们担心小屏幕会影响内容消费。再后来到 2014 年,我们推出了“网页答案”功能,即在搜索结果列表外展示的特色摘要  —— 同样出现了类似的疑问。

我依旧保持乐观态度。从多年的数据来看,人类的好奇心是无穷尽的,这也是我们在搜索引擎中深切体会到的。与其他公司相比,我们更致力于在变革中保持独特的方法论。我们深知生态系统的重要性,这是一个共生共荣的关系。如果没有丰富多彩的内容创作者提供独特且实用的信息,搜索引擎又何以立足?

Nilay Patel:一些小型企业正感受到压力。他们大声疾呼:“我们的生意正在流失。”

而你的回应则是:“我们正在和他们沟通,我们在交流。” —— 这和实际看到的现象不太一样。

Sundar Pichai:我不确定这是否是一个普遍趋势。我需要从汇总数据来分析,因为个例总会出现,总是有人进入某个领域后说:“作为一个特定的网站,我的表现变差了。”但这就像一个单独的餐馆说,“我今年开始接待更少的顾客。人们停止吃饭了”,这些话并不一定是真的,可能隔壁有其他餐馆开张并且做得很好。所以很难说。

从我们的角度来看,当我回顾过去十年的历史时,我们为生态系统提供了更多的流量,并且我们推动了这种增长。颇具讽刺意味的是,有些时候我们调整策略,正是为了给小型网站输送更多访问量那些频繁抱怨的,反而是处于中间环节的聚合平台。问题由此引申:流量应当归属谁——是直接搭建菜单网站的餐馆,还是撰写评论的博主?这触及了深层的议题,没有简单的对错之分。

Nilay Patel:当前网络上激励内容创作的动力似乎正逐渐减弱。

Sundar Pichai:但我的看法恰恰相反。实际上,通过 AI Overviews 提供丰富背景信息,确实有时用户只想要快速答案然后就离开。但总体来看,当我们观察用户的浏览路径时,提供上下文不仅让用户接触到跳转点,还促使他们更加深入参与。实际上,这才是长期驱动增长的因素。从桌面到移动设备的转变过程中,我们也遇到了类似的问题。

以前有杂志宣传“互联网已死”,十年前还有过关于“谷歌零点击”的争论。但你自己也提到,我们仍然是最大的推荐来源之一 —— 这并非偶然,而是因为我们长期致力于此。

回顾我们的历程,即便是去年通过搜索生成体验所做的努力,我也不断发现我们优先考虑那些在满足用户期望的同时能带来更多流量的方法。我们深入思考并实际调整我们的策略。如果在某些方面我们感觉还没有完全做对,我们会谨慎地推进。但令我们感到积极惊讶的是,人们参与度更高了,这将随着时间推移为高质量内容带来更多的增长

至于何为高质量内容,众说纷纭。对我而言,独立来源、小规模产出及真实声音尤为重要,这也是我们持续追求提升的方向。

Nilay Patel:你提到,AI Overviews 可能会吸引更多点击。Liz Reid 在谷歌搜索团队的博文中也有相似观点,但目前尚无公开数据证实这一说法。是否有计划公布相关数据?这一趋势是否确实在发生?

Sundar Pichai:从宏观看,整个生态系统的价值在于用户能否从中获益。若用户感受不到价值,网站主无法从谷歌得到回报,我们也将承担后果。我们的激励体系是正确的。当然,我们对…个体差异持谨慎态度,用户的选择路径也各不相同,这部分难以精确解析。不过,我们承诺在宏观层面,坚持做对的事情。

Nilay Patel:有人指出,在搜索控制台中,它不会显示点击来自特色摘要、AI Overviews 还是谷歌常规的“10 条蓝色链接”。

你会将它们分开统计吗?你会承诺分开统计,以便人们能够审计、验证并衡量 AI Overviews 确实如你所说那样带来了多少流量吗?

Sundar Pichai:这个问题更适合搜索团队来回答。他们在这一领域有更深入的考量。我们确实在努力增强透明度,同时鼓励内容创作者生产优质内容。我们的目标是合理排序与组织信息,所以我认为这里需要找到一个平衡。过于细化的标准可能导致针对性设计,这里面存在权衡。因此,我还不清楚什么是正确的答案。

需要非常明确的是,有一种误解的声音认为谷歌的搜索一直是“10 条蓝色链接”——但请看看我们的移动体验——很多很多年了。其实我们早就有了答案功能,允许你精炼问题,还有特色摘要等等。产品已经发生了显著演变。

话虽如此,作为一家公司,即使我们在关注 AI,我们也推出了 Google News Showcase,进行了授权交易。在有明确价值的情况下,我们显然认为在有益和变革性使用的背景下存在公平使用的案例。但我认为,有些情况下我们会看到对我们的模型有专门的增量价值,我们会考虑建立合作关系来获取这些价值。

Nilay Patel:最近有一些新闻报道说 OpenAI 在其视频生成产品 Sora 的训练中使用了 YouTube。当你听到这个消息时有何感想?

Sundar Pichai:我们并不了解具体细节。我们的 YouTube 团队正在跟进并尝试理解。我们有自己的条款和条件,我们期望人们在构建产品时遵守这些条款和条件,这就是我对这件事的感受。

Nilay Patel:所以你觉得他们可能违反了你们的条款和条件?或者说,如果他们真的这么做了,那是不合适的?

Sundar Pichai:没错。

Nilay Patel:我之所以问这个问题,是因为 OpenAI 的言外之意是“他们有能力在网络上收集这些数据”。

大多数创作者没有这种机会。他们没有一支由许可专家组成的、手握条款和条件的 YouTube 团队。他们甚至没有自己的条款和条件。他们只是把自己的创作放在互联网上。所以你是否理解,为什么创意社区在情感上对 AI 有如此剧烈的反应——就像你对 OpenAI 基于 YouTube 进行训练可能产生的感受一样?

Sundar Pichai:我绝对能理解。不论是网站所有者、内容创作者还是艺术家,我能理解这种转变对他们的心情影响有多大。这也是为什么在 Google I/O 上,即便是在开发音乐生成这样的产品时,我们都采取了一种首先为艺术家制作工具的方法。我们并没有推出一个通用的工具让任何人去创作歌曲。

在很多这类情况下,我们采取的方法是尽可能将创作者群体置于中心位置。我们在 YouTube 上早就这么做了。在这整个过程中,我们都在努力找出处理这一问题的正确方法。

但这同样是一个变革时刻,生态系统中还有其他参与者。我们不是唯一的玩家。但回到你早先的问题,是的,我理解人们对它的感情,我对此感同身受。

Nilay Patel:创作者们都觉得这仿佛是一场掠夺——自己辛勤创作的内容放上互联网,随后大型企业介入,免费取用,进而打造出月费 20 美元的产品,或是利用他们的创意进行再创作,传递给更多人。而且他们从中获得的回馈微乎其微,加剧了这种被掠夺的感觉。

所以我很好奇,你们会如何将价值反馈给他们?你们会如何为那些小型创作者或独立企业重新注入动力,让他们说:“瞧,这不再是一场掠夺!”

Sundar Pichai:我们在 YouTube 这样的平台上取得成功,主要在于我们努力解答了这个问题。你将持续看到我们在如何做得更好上深入探索。我认为,长远来看,能在这方面做得更出色的一方将握有更多胜算。我对此坚信不疑。我们做的每一件事,都必须解决这个问题。运营平台时,这是构建可持续未来的基石。随着 AI 时代的到来,随着时间推进,那些更有效地支持平台上内容创作者的参与者将会胜出。我相信这是这些事物发展的核心原则。

Nilay Patel:我发现特别有意思的一点是对 YouTube 的类比——有人常把它描述为许可业务。你们确实从创作者那里获得了大量内容许可,并通过广告模式给予他们回报

音乐行业与 YouTube 也有着庞大的许可合作。这是一种相互依存的关系。Susan Wojcicki 曾称 YouTube 为音乐服务,这让很多人困惑,直到数据揭示了真相。环球音乐则对 YouTube 上的 AI 使用表示愤怒,而 YouTube 做出了回应,开发了一系列工具,制定了 AI 的使用规则。

人们对于网络上的 AI 搜索体验感到不满,而 Google 的应对方式不同。我很想知道你如何看待这种差异。

Sundar Pichai:你说的东西和事实不符。

Nilay Patel:你是这样认为的吗?

Sundar Pichai:这太偏离事实了。因为其他竞争对手的处理方式是——

Nilay Patel:你在说 OpenAI 吗?他们的做法就是从网上直接拿取创作内容。

Sundar Pichai:……当我们处理搜索生成体验时,即使在这样的时刻,我们也在花时间测试、迭代和优化方法,这是我们多年来的实践,我必须指出,我完全不同意我们不听从反馈的说法。我们非常关心反馈,我们确实在倾听(用户的声音)。人们或许不会认同我们做的一切。运营一个生态系统,就是在平衡各种需求。我认为这是产品成功的关键所在

Nilay Patel:让我从另一面探讨这个问题。

搜索领域存在这样的情况:人们会操纵搜索结果,造成一个无解的循环。此外,AI 内容目前正逐渐充斥网络。几个月前,有个 SEO 专家向我炫耀道:“我从竞争对手那里偷走了大量流量。我复制了他们的站点地图,输入 AI 系统,生成了一个与之匹配的网站副本,然后从对手那里抢走了大量流量。”

我认为这是不良后果。我们不希望任何形式鼓励这种行为。这种情况会大规模发生。我们体验的互联网将越来越多地包含生成式 AI 内容。所以,一方面,你会如何构建 AIGC 内容的系统?另一方面,你会如何对其进行排名,确保用户获取最佳内容?要知道,网上有很多人正在呐喊:“我想要人类创作的内容,而非AI 生成的。”

Sundar Pichai:你的问题有多重含义。首先,我们如何区分优质和劣质内容?我认为这是我们的使命,也是多年定义搜索的核心。每次出现颠覆性的平台变革,都会经历这样的阶段,我看到我们的团队付出了巨大努力。搜索质量团队在过去一年中不断强化排名系统,以更好地识别高质量内容。展望未来十年,我认为,那些能够更好地筛选内容的人将脱颖而出。

我同意,人们会珍视人类创造的体验。我们需谨慎对待新技术。比如电影界,谈及电影中的 CGI,很多导演会情绪激动,至今仍有许多备受尊敬的导演拒绝在电影中使用 CGI。但也有人用它创造了伟大作品。AI 可以用于视频效果的布局和增强,但我同意你的观点,纯粹用 AI 大规模生产内容而无增值,并非用户的需求。但这是一个广阔的范围,用户在逐步适应。我们努力以负责任的方式实现这一点,同时倾听用户对高质量内容的看法,寻找平衡。这个范围未来几年内会有所变化,但我认为,这正是搜索质量的本质。

我对我们能比别人处理得更好很有信心,因为这正是我们工作的核心。

Nilay Patel:你对 OpenAI 的微妙批评很明显。

我刚在网上进行了搜索:“最好的 Chromebook”。之后,我点击顶部的“生成”,它给出了答案:“这是你可以考虑的一些选项。”下滑页面,它会展示一些 Chromebook —— 也没说它们是不是最好的 —— 接着列出一堆标题链接。

这种情况下,AI 生成搜索似乎能比传统搜索表现得更好。你认为这是良好的体验吗?这是终点还是一个里程碑?

Sundar Pichai:我认为,你展示的是我们未使用 AI 自动生成的查询结果。但让我辩解一下。这里有个重要区别。我们没有为这个查询展示 AI Overviews,是因为作为用户,你正在进行一个动作,而我们尊重你的意图。我滑动时,看到了 Chromebook,还有一系列链接,我可以点击,它们告诉我所有关于选择 Chromebook 的信息。我们没有展示 AI Overviews,是因为用户在生成后续问题。我认为尊重用户意图是正确的。如果不这样做,用户会去其他地方。

Nilay Patel:但我的意思是 —— 我没输入“什么是最好的 Chromebook?”我只打了“最好的 Chromebook” —— 然后,答案,或者说是“自称为答案”的东西,不在那个页面上。

从“我必须点击”到“Google 替我点击并给出它认为的答案”只是一步之遥。我想知道你是否认为像这样的页面是搜索体验的终点,或者这只是个里程碑,预示着未来会有更好的版本。

Sundar Pichai:这些体验如何演进,难以精确预测。用户需求不断进化,当前是一个动态变化的时期。我们正在测试所有这些,这是一个未触发 AI 摘要的案例,因为我们的 AI 摘要不一定是那个查询首选的体验,因为底层信息可能对用户来说是更好的初次接触点——这些都是我们基于质量做出的考量。但如果用户要求摘要,我们会总结并提供链接。我认为这是合理的方向。

关于搜索,我们处理的是数十亿次查询,所以你当然能从中找到一个查询,并问我:“我们能做得更好吗?” 我会告诉你:当然。

但在很多情况下,人们之所以欢迎 AI Overviews,是因为我们提供的概览明显增添了价值,帮助他们看到了可能未曾考虑的方面。如果你在这一层面增加了价值,我认为用户会逐渐感受到,我认为这就是你要达到的标准。

我们的数据显示,过去 25 年来,如果我们做的事情对用户没有价值或愉悦,他们会立刻反馈给我们。我们一再见证这一点。通过这次转变,一切都在变化。这是我们产品中最大的质量改进之一。用户珍视这种体验。人们往往认为用户不知所措,我坚决反对这种说法。使用 Google 的人都很精明,所以他们明白。

对我而言,我能举出很多作为用户使用 AI Overviews 的例子,比如,“哦,这提供了背景信息。哦,可能还有这些我原本没想到的维度。我该如何拓展查询看看呢?”

Nilay Patel:你似乎间接提到了 OpenAI 几次。

Sundar Pichai:其实我没有。

Nilay Patel:你提到了“别人”,也可能是其他竞争对手,比如(Meta)……

Sundar Pichai:你在曲解我的意思,但没关系。

Nilay Patel:我之前看了 OpenAI 的 GPT-4o 演示。它看起来和你在 I/O 上给出的演示很像 —— 这种多模态搜索的概念,和人类交谈的角色。你有感受到来自竞争的压力吗?

Sundar Pichai:这与 Siri 和 Alexa 没有什么不同。当你在技术行业工作时,我认为我们几年前都感受到了无情的创新,我们所有人都在构建语音助手。你可以问同样版本的这个问题:Alexa 试图做什么,Siri 试图做什么?这是它的自然延伸。我认为你现在有一项新技术,它正在快速发展。

对于科技而言,这是美好的一周,无数创新在这周诞生,这就是我的感受。我认为这种情况将持续一段时间,且我宁愿这样。我会宁愿处于一个基础技术正在发展的阶段,这意味着我可以彻底改进我正在提供的体验。我宁愿这样,也不愿处于一个你觉得无法快速前进的静态阶段

我们很多人都对“强大的智能助手可以成为什么”有一个愿景,但我们被基础技术所阻碍,无法实现那个目标。所以进步是很令人兴奋的。对我来说,我看着它说,“我们实际上可以让 Google 助手变得更好。”

Nilay Patel:这让我回到了我问的第一个问题:语言与智能。要制作这些产品,我认为你需要一个核心级别的智能。你心里对此有没有一个衡量标准?

Sundar Pichai:你触及了幻觉问题的核心,这仍是待解的难题。某种程度上,这几乎是这类模型的固有属性,正是它赋予了模型惊人的创造力,但同时也表明,大语言模型在追求准确性上并非万能,这也正是我对搜索引擎的发展感到兴奋的原因之一。

在搜索引擎领域,我们引入了大模型,并结合了搜索技术和丰富的上下文信息,力求提供更优质的体验。那些免责声明的存在,恰恰反映出这种内在的局限性——有时它会出错,但这不应抹杀其潜在的巨大价值,过分悲观绝非明智之举

Google Lens 是一个很好的例子。最初推出 Google Lens 时,它并不能很好地识别所有物体。但逐年来看,进步相当显著,用户使用也越来越频繁。现在我们已经有数十亿次使用 Google Lens 的查询。这是因为底层的图像识别与我们实体知识理解的结合随着时间的推移有了极大的扩展。

Nilay Patel:对于幻觉问题的解决方案,是否已在规划中?

Sundar Pichai:我们是否取得了进展?是的,我们有。当我们逐年查看有关事实性的指标时,确实取得了进步。我们都在使其变得更好,但问题尚未解决。他们是否有正在研究的有趣想法和方法?确实有,但时间会告诉我们答案。我认为大模型是 AI 的一个方面。我们正在以更广泛的方式研究 AI,但这绝对是我们在努力推动更多进展的领域。

Nilay Patel:五年后,我们可能会度过这一轮范式转变迎来新阶段。你心目中最理想的未来网络图景是怎样的?

Sundar Pichai:我期待网络在多模态交互上能有质的飞跃。当前,网络承载信息的方式尚未全面覆盖人类接收信息的习惯。信息以网页、视频等形式分散各处,我期望未来的网络能更紧密融合,形态更多样、互动性更强,状态感知能力更佳,而非如现在这般静态。

我认为,虽然人们可能会使用 AI 生成大量垃圾信息,但每当有新的技术浪潮出现时,人们都不知道如何使用它。移动时代来临时,大家先是把网页塞进移动应用,后来才发展出真正原生的移动应用

AI 的应用也一样,等 AI 应用真正爆发时,我认为网络也将变得更加丰富。比如,AI 可根据个人偏好动态构建界面,尽管目前尚未普及,但 AI 有能力在未来实现这一愿景。AI 可以帮助你随着时间的推移做到这一点。在这个过程中,难免有人可能会浅显地使用它,但总会有企业家找出一种非常好的方式来做到这一点,从中将会出现伟大新事物。

Nilay Patel:谷歌通过搜索、Chrome 和你所做的一切,为网络发展创造了很多激励措施。你如何确保这些激励措施与这些目标一致?你如何考虑确保这些激励措施指向正确的目标?

Sundar Pichai:不是所有事情都在谷歌的控制范围内。我希望我能影响作为用户今天访问网站时遇到的最糟糕体验 —— 比如需要接受很多 cookie 对话框等。所以我认为有很多因素是外部的。你可以去调查 100 个用户。

但我们希望创造什么样的激励措施呢?这是一个复杂的问题,即你如何奖励原创性、创造力和无论规模大小的独立声音,并让它们在我们创建的这个内容生态系统中得以繁荣发展?这是我思考的问题,也是搜索团队思考的问题。但我认为这是一个重要的原则,对网络和我们公司而言都很重要。

013a16b1e0e9d4c350916d680f51f744.gif

开发者正在迎接新一轮的技术浪潮变革。由 CSDN 和高端 IT 咨询和教育平台 Boolan 联合主办的 2024 年度「全球软件研发技术大会」秉承干货实料(案例)的内容原则,将于 7 月 4 日-5 日在北京正式举办。大会共设置了 12 个大会主题:大模型智能应用开发、软件开发智能化、AI 与 ML 智能运维、云原生架构……详情👉:http://sdcon.com.cn/

af02e33336bae92b1f9617652416b2c1.jpeg



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。