20240613 每日AI必读资讯

程序员的店小二 2024-06-15 13:31:12 阅读 77

🍏iOS 18.0 超详细体验报告！

iPhone 通话能录音了！

桌面图标可以自由排列了，还能选主题了！

控制中心变秃了，也变强了！

锁屏的手电筒和相机可以换成别的了！

所有 App 支持上锁和隐藏了！

……

🔗 体验了一整天iOS 18，我竟然觉得它挺值得升。。。-CSDN博客

🎨 Midjourney推出模型个性化功能

- 模型个性化功能允许用户根据审美偏好微调MJ模型，生成更符合个人喜好的图像风格。

- 个性化模型通过分析用户过往喜欢和收藏的图片来学习用户的审美偏好，提高生成图像的准确性。

- 用户可以使用--p参数或在/settings中设置个性化选项来启用个性化功能，控制个性化效果的强度并分享个性化代码给他人体验。

🔗 https://www.midjourney.com/rank

🎭 Follow-Your-Emoji：通过捕捉人物表情变化生成表情丰富的动画

- 给定一个视频，会提取包含面部特征和瞳孔点，但排除面部轮廓

- 给定一张照片，能根据提取的特征作为运动表示引导视频动画生成，同时能够捕捉微妙表情变化。

- Follow-Your-Emoji能做什么？

1、身份保持：生成动画时，确保参考头像的身份特征不会丢失。

2、表情丰富：生成各种夸张和细微的表情，如大幅度的瞳孔运动。

3、多样化风格：支持多种风格的头像动画，包括卡通、现实人物、雕塑和动物等。

4、长时间动画：使用渐进生成策略，确保长时间动画的稳定性和一致性。

🔗 Follow-Your-Emoji: Freestyle Portrait Animation

🤖苹果公布其 Apple Intelligence 背后的基础生成模型

- 一个约30亿参数的设备端模型和一个基于服务器的语言模型

- 评估结果显示：与开源模型（如 Phi-3、Gemma、Mistral、DBRX）和商业模型（如 GPT-3.5-Turbo、GPT-4-Turbo）进行了比较。

- 评估结果表明，Apple 的模型在大多数情况下被人类评估者优先选择。

- Apple Intelligence内置的基础模型被优化用于文本写作与润色、通知的优先级排序与摘要、为与家人朋友的对话创建有趣的图像，以及简化应用内的交互。

🔗 https://blink.csdn.net/details/1726884

💻Proofread：利用大语言模型自动修正键盘输入的文本错误

- Proofread 是由Google提出一种基于大语言模型的一键式纠错功能，以提升用户的打字体验。

- 通过一次点击，可以自动修正他们输入的文本中的所有错误，在打字过程中甚至无需在意输入的字母顺序。

- Proofread 基于PaLM2-XS模型，调优后的PaLM2-XS模型在黄金集上的“好”比例达到了85.56%。

- 该功能已在Pixel 8设备上发布，支持数千名日活跃用户。

🔗 https://blink.csdn.net/details/1726883

🔍MIT开发新算法DenseAV：通过观看视频学习语言含义

- DenseAV是双编码器接地架构，通过观看视频学习语言含义和声音位置。

- 无监督学习下自动区分单词含义和声音位置的关联，提高定位信息能力。

- 在跨模态检索方面优于以前的模型ImageBind，有望应用于学习大量视频和理解新语言交流方式。

🔗 DenseAV

🌐微软发布公告：将于 2024 年 7 月 10 日停止创建 GPTs

- 并于 2024 年 7 月 10 日至 2024 年 7 月 14 日删除所有 GPTs（包括由微软和客户创建的 GPTs）以及它们的相关数据。

🔗理由模棱两可：

https://support.microsoft.com/en-us/topic/d1de6c3a-4c7a-4bcd-98ff-2f65f3d23cd1

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。