20240628 每日AI必读资讯

程序员的店小二 2024-07-12 10:01:01 阅读 72

📚 OpenAI发布CriticGPT:用GPT-4给GPT-4找错误

- OpenAI今日凌晨发布了一款基于GPT-4训练的代码审查模型CriticGPT,用于审查找到ChatGPT代码输出中的错误,表现比没用此工具的人要好60%。

- OpenAI开始将类似CriticGPT模型集成到其RLHF标注流水线中,为其训练师提供明确的AI帮助。

🔗论文地址:https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf 

🎨Hugging Face 推出新版开源大模型排行榜,中国模型 Qwen-72B 夺冠

- 阿里Qwen-2-72B指令微调版本问鼎全球开源大模型排行榜榜首

- Llama-3-70B 微调版本排名第二,而 Mixtral-8x22B 微调版本位居第四。

- 另外,微软的 Phi-3-Medium-4K14B 模型排名第五,展示了小参数模型的潜力

- 中国零一万物的 Yi-1.5-34B-Chat 版本排在了第六名,Cohere 开源的 Command R+104B 模型排名第七。中国开源模型领先地位稳固

- Qwen-2展现出与国际著名闭源大模型平台不俗的竞争实力

🤖Claude 推出了自己的类似GPTs 的聊天机器人功能

- 该功能为“Projects”,类似 ChatGPT 的GPTs,可以创建个性化的机器人。

- 与GPTs不同的是,可以针对特定的项目来创建专属项目机器人,一次性将该项目的所有相关资料文档上传到Projects里面,作为本次项目的知识库,机器人就能记住所有的内容。

- 可以针对机器人设定提示词指令,要求它输出的标准、风格和其他需求。这样claude就能根据你的需求从这些文档里面进行内容的输出工作。

- 还可以和团队进行分享对话协作...

🔗 Introducing Claude 3.5 Sonnet \ Anthropic

 💻字节跳动发布AI开发工具:豆包MarsCode 

- 无需配置复杂的开发环境,让你在浏览器中即可进行编程和调试等各种工作。

- 豆包 MarsCode 编程助手,支持了多种编程语言以及主流的 IDE,它能够在开发过程中对单行代码乃至整个函数提供编写提议。

- 还可以进行代码补全、Bug修复和单元测试生成等大幅提高开发效率!

- 豆包 MarsCode 还包括一个AI 原生的云端集成开发环境(IDE)。

 🔗访问:https://www.marscode.cn/

🚀Figma界面大改版并推AI设计工具:几秒生成初始设计稿

- Figma AI 帮助用户更快地找到所需内容,自动生成设计初稿,并自动完成繁琐任务,让设计师专注于创意部分。

视觉搜索: 上传图像即可找到精确匹配或类似设计。

生成初稿: 使根据提示生成不同风格和布局的设计初稿。

即时原型制作: 将静态模型瞬间转换为互动原型。

自动命名图层: 一键智能命名和组织图层。

🔗官方介绍:https://www.figma.com/blog/introducing-figma-ai/

🔗 Figma在Config2024大会上发布了一系列新功能和更-CSDN blink-领先的开发者技术社区

⚙️解决AI视频造假难题?DIVID检测AI生成的视频准确率高达93.7%

- DIVID工具可以以93.7%准确率检测AI生成视频

- DIVID识别扩散模型生成的视频,逐渐转化为高质量、逼真的图像

- 研究人员将Raidar的AI生成文本洞察力扩展到视频,通过编辑次数判断真实性

🔗 https://arxiv.org/abs/2406.09601

 🧠研究发现大学居家考试中 94% 的 AI 答案未被发现 

- 英国雷丁大学的一项研究发现,在大学考试中,有94%的AI生成内容完全没有被老师发现。

- AI 答案的平均得分竟比真人学生高出半个等级。

- AI的「以假乱真」程度再次被证实,在能力上不仅可以替代掉打工人,还在认知任务上完全碾压了大学生。

🔗 GPT-4顶替大学生参加考试,94%作弊未被揭穿!AI作弊毫无破绽-CSDN博客



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。