20240904 每日AI必读资讯

程序员的店小二 2024-09-19 12:01:01 阅读 96

中国首个通用泛化机器人终于来了!清华校友打造中国版Figure 01,连续泛化丝滑处理多任务

- 「千寻智能 Spirit AI」具身智能公司,首次展示出了强大的多任务连续泛化能力。

- 幕后技术团队纷纷出自UC Berkeley、CMU、NTU、清华、北大、浙大、华为、腾讯、大疆、小米等国内外顶尖高校、企业。

- 这个机器人,是真正由模型训练出来的

- 据了解,截止目前除了Figure 01,国内似乎还没有第二家能做到这种级别的泛化能力,即使被百般刁难,都能完成任务。

- 清华校友下场创业,才4个月就已融资近2亿。

🔗中国首个通用泛化机器人终于来了!

 

上海人工智能实验室发布智能数据提取工具MinerU

- MinerU是全新智能数据提取工具,简化AI数据处理流程,提高数据提取质量。

- 包含Magic-PDF和Magic-Doc两大部分,支持多模态PDF文档转化为Markdown,网页内容提取与格式转换。

- 利用LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR等模型实现高质量文档数据提取。

🔗https://modelscope.cn/studios/OpenDataLab/MinerU

Jina AI发布 Jina ColBERT v2: 一个多语言的晚期交互信息检索模型

- 核心思想是先分别对查询和文档进行编码,然后在最后阶段才让它们“互动”或“对比”。

- 文档的编码可以提前完成并存储起来,当有查询进来时,只需要进行简单而快速的对比,大大提高了搜索的速度。

🔗详细:https://xiaohu.ai/p/13075

🔗官方blog:https://jina.ai/news/jina-colbert-v2-multilingual-late-interaction-retriever-for-embedding-and-reranking/

🔗技术报告:https://arxiv.org/pdf/2408.16672

中国版 Sora!Minimax 推出一款基于DIT架构的 AI 视频工具:海螺视频

- MiniMax推出多款多模态模型,包括语音模型、音乐模型和视频生成模型。

-  Minimax 也推出了自己基于DIT架构的 AI 视频工具:海螺视频。该模型(代号abab-video-1)在处理高动态、变化多的视频信息时表现尤为出色,同时保持高效的压缩率。

 

- 能模拟现实世界物理规律,在生成复杂场景和高动作场景时表现出色

 

- 支持多种视频风格,无论是3D电影大片场景、2D动画,还是中式风格、科幻风格或美漫风格,均能轻松驾驭。

 

- 据悉abab-video-1目前已参考“视频生成模型的评测框架”V-Bench进行了评测,得分排名第一,比可灵和runway都高。

- abab-video-1具有压缩率高、文本响应好、风格多样,支持原生高分辨率、高帧率视频等特点,媲美电影质感。

🔗在线体验:https://hailuoai.com/

🔗 MiniMax发布三款模型 

Cursor开源平替来了!AI编程工具Melty让编程效率提升 10 倍

- Melty是一款开源的AI代码编辑器,能够实时理解开发者的需求,帮助写出高质量的代码。

- 创始团队在Y Combinator的支持下快速迭代,经过28天开发,Melty能自动编写一半的代码!

- 它不仅提升编程效率,还能帮助你更好地理解代码变化。

🔗详情链接:Melty — open source AI code editor



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。