20240815 每日AI必读资讯
程序员的店小二 2024-09-10 11:31:16 阅读 54
📱对标GPT-4o!谷歌版Her——Gemini Live大翻车
- Gemini Live提供自由流畅的对话体验,支持免提使用,如口袋里的聊天助手。
- Gemini集成多种谷歌应用,提供日常帮助,无需在不同应用间切换。
- 谷歌引入Gemini1.5Flash模型以提高响应速度和质量,持续优化用户体验。
🔗详情链接:https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
🔗 谷歌版Her大翻车:试了3次且换手机才成功…网友:我手动只需10秒-CSDN博客
🔍马斯克旗下xAI发布Grok-2和Grok-2mini测试版
- Grok-2和Grok-2mini是重大升级,在聊天、编码和推理方面有突破性进展。
- Grok的图像生成功能引发广泛关注,可能面临政治虚假信息传播压力。
- xAI计划在X平台上部署多项AI驱动功能,包括改进的搜索功能和回复系统。
🔗详情:https://blink.csdn.net/details/1785928
📱AI加持!谷歌Pixel 9系列手机发布:搭载Tensor G4芯片 支持Gemini
- Pixel 9系列包括Pixel9、Pixel9Pro、Pixel9Pro XL和Pixel9Pro Fold,配备Tensor G4芯片,高内存容量,满足AI需求。
- 摄像头配置高规格,Pro版本支持5倍光学变焦和30倍数字变焦。
- Gemini深度整合入安卓系统,提供覆盖层功能,即将扩展到iOS系统。
🔗 https://blink.csdn.net/details/1785921
🛠️谷歌发布AI文生图应用Pixel Studio
- 基于 Imagen 3 模型,本地 AI 文生图应用,可2 秒内生成各种图像。
- Google表示Pixel Studio将预装在每台 Pixel 9 系列手机上。只需简单的提示词即可生成你想要的图像。
- 谷歌 Pixel Studio 依赖谷歌 Tensor G4 SoC 芯片来生成图片,如果用户想要更优秀的内容,可以调用 Gemini 在云端生成图片。
- Imagen 3的能力大幅提升
🔗线上版本体验:https://aitestkitchen.withgoogle.com/zh/tools/image-fx
🎙️Eleven Labs 推出全托管的AI自动配音服务
- 可以将各种短视频和长视频内容自动翻译成西班牙语、印地语、法语、葡萄牙语、德语、阿拉伯语、波兰语等。
- 会自动的匹配用户的声音音调、音色和说话风格。
- 支持不超过10个说话者的视频内容,平均自动翻译配音需要 7 天,但在特殊情况下可当天完成。
- 演示案例——翻译配音是没啥问题,但是似乎很多时候无法保持唇形同步。
🔗详细内容:https://elevenlabs.io/elevenstudios
🔗https://blink.csdn.net/details/1785924
🚀成功率高达95.4%!Agent Q横空出世,AI界新秀还是草莓营销大师?
- Agent Q成功率高达95.4%,结合搜索、自我反思和强化学习。
- CEO使用草莓表情引发关注,背后或有OpenAI的Q*项目加持。
- Agent Q展现强大搜索能力,在真实预订任务中成功率提升至81.7%,仅经过一天自主数据收集。
🔗详情链接:https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。