20240530 每日AI必读资讯

程序员的店小二 2024-06-25 12:01:03 阅读 53

📂OpenAI宣布所有 ChatGPT Free 用户免费使用！！

- GPT3.5用户现在都可以免费使用网络浏览、视觉、数据分析、文件上传和创建GPTs功能

📰美国AI禁令再升级：在美从事AI职业中国人或需要特殊许可

- 美国众议院通过「加强海外关键出口限制的国家框架法案」（ENFORCE法案）

- 该法案建议将人工智能、人工智能系统和涉及的人工智能系统的定义，纳入2018年《出口管制改革法》。

能力包括：

- 使专家或非专家能够设计、合成或获取危险的化学、生物、放射性或大规模杀伤性武器；

- 进行进攻性网络操作；

- 通过欺骗或混淆手段规避人类控制；

- 展示出与上述能力技术上相似或等效的性能。

🌐ChatTTS：专门为对话场景设计的文本到语音TTS模型

- 该模型经过超过10万小时的训练，公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。

- 专为对话任务优化，能够支持多种说话人语音，中英文混合等。

- 模型还能够预测和控制细粒度的韵律特征，如笑声、停顿和插话等，还能进行更细粒度的调整，如语速、音调和情感等。

🔗 GitHub：https://github.com/2noise/ChatTTS

🛠️Khoj：一个开源的个人化AI 助手

- 能连接在线和本地文档，充当第二大脑。

- 可以连接本地的PDF等文件和在线Markdown、GitHub和Notion文件，并将它们与在线信息整合在一起。

- 在文档和笔记中提供快速、准确的语义搜索，帮助你快速找到所需信息。

- 还可以集成搭配 Obsidian 笔记工具

- 支持语音输入、图像生成、AI代理、联网搜索、支持网页、客户端，集成到聊天软件等各种访问方式。

🔗 https://blink.csdn.net/details/1711857

🤖Llama3-V：只用500美元的成本构建的基于 Llama3 的多模态模型

在几乎所有指标上，Llama 3-V 的性能与GPT-4V、Gemini Ultra和Claude Opus等规模大100倍的闭源模型相当。

唯一的例外是MMM U（多模态记忆任务），Llama 3-V略逊一筹。

Llama3-V 的架构结合了视觉模型和语言模型，由 Llama3 8B 和 siglip-so400m 驱动。

整个训练成本不到500美元。

🔗 HF Model：https://huggingface.co/mustafaaljadery/llama3v…

🔗 Github Repo：GitHub - mustafaaljadery/llama3v: A SOTA vision model built on top of llama3 8B.

🔍网信办等三部门：加快推进大模型、生成式人工智能标准研制

- 中央网信办、市场监管总局、工业和信息化部联合印发的《信息化标准建设行动计划（2024—2027年）》

- 信息化标准建设行动计划：加强国家信息化标准体系，推动网络强国建设。

- 推进重点领域标准研制：包括人工智能、区块链、云计算等领域的标准研制。

- 提升信息化标准基础能力：优化标准供给结构，加强标准化人才培养，推动标准数字化发展。

🎯OpenAI正训练GPT-4的继任者，GPT-5或将带来三个重大升级

- 更高准确性: GPT-5将通过更多数据训练提高回答准确性。

- 增加多模态: GPT-5有望支持视频输出，处理更多种类输入输出。

- 实现自主行动能力（AGI）: GPT-5有望具备人工通用智能，能理解用户意图并自主完成任务。

🚀又炸！GPT-4o可自动生成Figma设计稿

- 自动化设计生成：根据PRD自动生成Figma设计稿，支持高质量设计系统。

- 理解PRD需求：能解析产品需求文档，填充样式、图标库和文本内容。

- 全球关注与期待：引起设计行业关注，被认为将改变设计行业格局。

🔗 https://blink.csdn.net/details/1711861

上一篇：读AI新生：破解人机共存密码笔记11智能爆炸

下一篇： FastGPT | 3分钟构建属于自己的AI智能助手

本文标签

20240530 每日AI必读资讯

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。

20240530 每日AI必读资讯

本文标签

声明

相关文章

阅读排行

热门文章