20240925 每日AI必读资讯

o1模型o1-preview模型在600个Blocksworld问题中的准确率为97.8%,这是现有模型中的最高表现,明显优于其他LLMs。-其中豆包视频生成模型,基于DIT架构可以实现一个Prompt的...

20240927 每日AI必读资讯

我们最近发布的语音到语音转换和OpenAIO1标志着交互和智能的新时代的开始——这些成就是由你们的聪明才智和手艺实现的。在这个过程中,AI会通过多次尝试得到反馈。这个阶段的重点是让AI明白哪些地方出错了,并且不会...

20240922 每日AI必读资讯

例如,HyungWonChung提出,为了解决语言模型中的“幻觉问题”(hallucination),可以设计奖励结构,使得模型不仅仅追求回答问题的正确性,还要学会在不确定的情况下说“不知道”。他指出,AI...

20240917 每日AI必读资讯

7.CVPR2025的PCs计划将CVPR2025的审稿数据私下分享给未来相关会议的PCs。这些数据将精准地「归责到人」,包括对审稿质量的评估以及迟交的统计数据。-o1-preview模型在网络...

20240825 每日AI必读资讯

新部门成立于3月,目的是加强微软在消费者AI战略方面的布局,涵盖副驾驶AI聊天机器人和Bing搜索引擎等项目,由DeepMind联合创始人MustafaSuleyman领导。-新成立的AI部门的软件工程师平均总...

20240923 每日AI必读资讯

StoryMaker可以通过文本提示控制生成图像的背景、姿势和风格,使得用户可以根据不同的场景需求生成符合叙事需求的图像序列。-该模型支持包括服装交换、角色插值等功能,并能与其他生成插件(如LoRA、Con...

20240921 每日AI必读资讯

仅限部分设备使用,包括iPhone15Pro、iPhone16和iPhone16Pro,以及配备M1或更新芯片的iPad和Mac。-Moshi的核心技术包括Helium文本语言模型、Mimi神经音频编解...

20240910 每日AI必读资讯

Baszucki描绘了一个设想的场景:例如在一个虚拟的D&D游戏中,游戏世界可以随着地牢主的描述而即时生成,玩家的每一个行动都能实时影响环境的变化。-Mini-Omni不仅在语音识别(ASR)和语音生成(T...

20240911 每日AI必读资讯

支持多个平台开发,提供SDK(软件开发工具包)供开发者使用,包括React、JS、Unity、Swift、iOS、Android、Flutter、Rust、Next.js等。这使得开发者可以快速构建和集成各...

20240926 每日AI必读资讯

本地AI模型的部署与使用:快速安装和设置本地AI工具,如Ollama、Qdrant和PostgresQL。例如通过Ollama平台,本地部署并运行最新的AI模型,如语言生成模型,用户可以在本地处理复杂的...