20240815 每日AI必读资讯

程序员的店小二 2024-09-10 11:31:16 阅读 54

📱对标GPT-4o！谷歌版Her——Gemini Live大翻车

- Gemini Live提供自由流畅的对话体验，支持免提使用，如口袋里的聊天助手。

- Gemini集成多种谷歌应用，提供日常帮助，无需在不同应用间切换。

- 谷歌引入Gemini1.5Flash模型以提高响应速度和质量，持续优化用户体验。

🔗详情链接：https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

🔗 谷歌版Her大翻车：试了3次且换手机才成功…网友：我手动只需10秒-CSDN博客

🔍马斯克旗下xAI发布Grok-2和Grok-2mini测试版

- Grok-2和Grok-2mini是重大升级，在聊天、编码和推理方面有突破性进展。

- Grok的图像生成功能引发广泛关注，可能面临政治虚假信息传播压力。

- xAI计划在X平台上部署多项AI驱动功能，包括改进的搜索功能和回复系统。

🔗详情：https://blink.csdn.net/details/1785928

📱AI加持！谷歌Pixel 9系列手机发布：搭载Tensor G4芯片支持Gemini

- Pixel 9系列包括Pixel9、Pixel9Pro、Pixel9Pro XL和Pixel9Pro Fold，配备Tensor G4芯片，高内存容量，满足AI需求。

- 摄像头配置高规格，Pro版本支持5倍光学变焦和30倍数字变焦。

- Gemini深度整合入安卓系统，提供覆盖层功能，即将扩展到iOS系统。

🔗 https://blink.csdn.net/details/1785921

🛠️谷歌发布AI文生图应用Pixel Studio

- 基于 Imagen 3 模型，本地 AI 文生图应用，可2 秒内生成各种图像。

- Google表示Pixel Studio将预装在每台 Pixel 9 系列手机上。只需简单的提示词即可生成你想要的图像。

- 谷歌 Pixel Studio 依赖谷歌 Tensor G4 SoC 芯片来生成图片，如果用户想要更优秀的内容，可以调用 Gemini 在云端生成图片。

- Imagen 3的能力大幅提升

🔗线上版本体验：https://aitestkitchen.withgoogle.com/zh/tools/image-fx

🎙️Eleven Labs 推出全托管的AI自动配音服务

- 可以将各种短视频和长视频内容自动翻译成西班牙语、印地语、法语、葡萄牙语、德语、阿拉伯语、波兰语等。

- 会自动的匹配用户的声音音调、音色和说话风格。

- 支持不超过10个说话者的视频内容，平均自动翻译配音需要 7 天，但在特殊情况下可当天完成。

- 演示案例——翻译配音是没啥问题，但是似乎很多时候无法保持唇形同步。

🔗详细内容：https://elevenlabs.io/elevenstudios

🔗https://blink.csdn.net/details/1785924

🚀成功率高达95.4%！Agent Q横空出世，AI界新秀还是草莓营销大师？

- Agent Q成功率高达95.4%，结合搜索、自我反思和强化学习。

- CEO使用草莓表情引发关注，背后或有OpenAI的Q*项目加持。

- Agent Q展现强大搜索能力，在真实预订任务中成功率提升至81.7%，仅经过一天自主数据收集。

🔗详情链接:https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

上一篇： AI开发者大赛 | 6道算法赛题上新

下一篇：深度学习笔记 # Datawhale X 李宏毅苹果书 AI夏令营

本文标签

20240815 每日AI必读资讯

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。

20240815 每日AI必读资讯

本文标签

声明

相关文章

阅读排行

热门文章