20240904 每日AI必读资讯

程序员的店小二 2024-09-19 12:01:01 阅读 96

中国首个通用泛化机器人终于来了！清华校友打造中国版Figure 01，连续泛化丝滑处理多任务

- 「千寻智能 Spirit AI」具身智能公司，首次展示出了强大的多任务连续泛化能力。

- 幕后技术团队纷纷出自UC Berkeley、CMU、NTU、清华、北大、浙大、华为、腾讯、大疆、小米等国内外顶尖高校、企业。

- 这个机器人，是真正由模型训练出来的

- 据了解，截止目前除了Figure 01，国内似乎还没有第二家能做到这种级别的泛化能力，即使被百般刁难，都能完成任务。

- 清华校友下场创业，才4个月就已融资近2亿。

🔗中国首个通用泛化机器人终于来了！

上海人工智能实验室发布智能数据提取工具MinerU

- MinerU是全新智能数据提取工具，简化AI数据处理流程，提高数据提取质量。

- 包含Magic-PDF和Magic-Doc两大部分，支持多模态PDF文档转化为Markdown，网页内容提取与格式转换。

- 利用LayoutLMv3、YOLOv8、UniMERNet和PaddleOCR等模型实现高质量文档数据提取。

🔗https://modelscope.cn/studios/OpenDataLab/MinerU

Jina AI发布 Jina ColBERT v2：一个多语言的晚期交互信息检索模型

- 核心思想是先分别对查询和文档进行编码，然后在最后阶段才让它们“互动”或“对比”。

- 文档的编码可以提前完成并存储起来，当有查询进来时，只需要进行简单而快速的对比，大大提高了搜索的速度。

🔗详细：https://xiaohu.ai/p/13075

🔗官方blog：https://jina.ai/news/jina-colbert-v2-multilingual-late-interaction-retriever-for-embedding-and-reranking/

🔗技术报告：https://arxiv.org/pdf/2408.16672

中国版 Sora！Minimax 推出一款基于DIT架构的 AI 视频工具：海螺视频

- MiniMax推出多款多模态模型，包括语音模型、音乐模型和视频生成模型。

- Minimax 也推出了自己基于DIT架构的 AI 视频工具：海螺视频。该模型(代号abab-video-1)在处理高动态、变化多的视频信息时表现尤为出色，同时保持高效的压缩率。

- 能模拟现实世界物理规律，在生成复杂场景和高动作场景时表现出色

- 支持多种视频风格，无论是3D电影大片场景、2D动画，还是中式风格、科幻风格或美漫风格，均能轻松驾驭。

- 据悉abab-video-1目前已参考“视频生成模型的评测框架”V-Bench进行了评测，得分排名第一，比可灵和runway都高。

- abab-video-1具有压缩率高、文本响应好、风格多样，支持原生高分辨率、高帧率视频等特点，媲美电影质感。

🔗在线体验：https://hailuoai.com/

🔗 MiniMax发布三款模型

Cursor开源平替来了！AI编程工具Melty让编程效率提升 10 倍

- Melty是一款开源的AI代码编辑器，能够实时理解开发者的需求，帮助写出高质量的代码。

- 创始团队在Y Combinator的支持下快速迭代，经过28天开发，Melty能自动编写一半的代码!

- 它不仅提升编程效率，还能帮助你更好地理解代码变化。

🔗详情链接：Melty — open source AI code editor

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。