20240815 每日AI必读资讯

程序员的店小二 2024-09-10 11:31:16 阅读 54

📱对标GPT-4o!谷歌版Her——Gemini Live大翻车

- Gemini Live提供自由流畅的对话体验,支持免提使用,如口袋里的聊天助手。

- Gemini集成多种谷歌应用,提供日常帮助,无需在不同应用间切换。

- 谷歌引入Gemini1.5Flash模型以提高响应速度和质量,持续优化用户体验。

🔗详情链接:https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

🔗 谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒-CSDN博客

🔍马斯克旗下xAI发布Grok-2和Grok-2mini测试版

- Grok-2和Grok-2mini是重大升级,在聊天、编码和推理方面有突破性进展。

- Grok的图像生成功能引发广泛关注,可能面临政治虚假信息传播压力。

- xAI计划在X平台上部署多项AI驱动功能,包括改进的搜索功能和回复系统。

🔗详情:https://blink.csdn.net/details/1785928

📱AI加持!谷歌Pixel 9系列手机发布:搭载Tensor G4芯片 支持Gemini

- Pixel 9系列包括Pixel9、Pixel9Pro、Pixel9Pro XL和Pixel9Pro Fold,配备Tensor G4芯片,高内存容量,满足AI需求。

- 摄像头配置高规格,Pro版本支持5倍光学变焦和30倍数字变焦。

- Gemini深度整合入安卓系统,提供覆盖层功能,即将扩展到iOS系统。

🔗 https://blink.csdn.net/details/1785921

🛠️谷歌发布AI文生图应用Pixel Studio

- 基于 Imagen 3 模型,本地 AI 文生图应用,可2 秒内生成各种图像。

- Google表示Pixel Studio将预装在每台 Pixel 9 系列手机上。只需简单的提示词即可生成你想要的图像。

- 谷歌 Pixel Studio 依赖谷歌 Tensor G4 SoC 芯片来生成图片,如果用户想要更优秀的内容,可以调用 Gemini 在云端生成图片。

- Imagen 3的能力大幅提升

🔗线上版本体验:https://aitestkitchen.withgoogle.com/zh/tools/image-fx

🎙️Eleven Labs 推出全托管的AI自动配音服务

- 可以将各种短视频和长视频内容自动翻译成西班牙语、印地语、法语、葡萄牙语、德语、阿拉伯语、波兰语等。

- 会自动的匹配用户的声音音调、音色和说话风格。

- 支持不超过10个说话者的视频内容,平均自动翻译配音需要 7 天,但在特殊情况下可当天完成。

- 演示案例——翻译配音是没啥问题,但是似乎很多时候无法保持唇形同步。

🔗详细内容:https://elevenlabs.io/elevenstudios

🔗https://blink.csdn.net/details/1785924

🚀成功率高达95.4%!Agent Q横空出世,AI界新秀还是草莓营销大师?

- Agent Q成功率高达95.4%,结合搜索、自我反思和强化学习。

- CEO使用草莓表情引发关注,背后或有OpenAI的Q*项目加持。

- Agent Q展现强大搜索能力,在真实预订任务中成功率提升至81.7%,仅经过一天自主数据收集。

🔗详情链接:https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。