ShowMeAI | 字节AIGC模型&工具大清单;AI解梦靠谱吗?AI MV制作手册;一文看懂MoE混合专家大模型;DeepSeek发布全球最强开源MoE模型
ShowMeAI 2024-07-02 14:01:02 阅读 90
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦!
1. 字节跳动生成式AI布局:卷到飞起的「App 工厂」这局也有点稳了?
字节最近有点猛啊!出圈的AI产品越来越多,迭代速度肉眼可见的快,「App 工厂」名不虚传 👍 根据能查到的信息,整理了一份「字节AI模型&产品清单」,遇到时可以确认 Made in ByteDance。> ⋙ 各产品详细信息可以看这里
🎨 模型层
Skylark (云雀):大语言模型,基于 Transformer 架构的自然语言处理模型,用于内容生成和理解 → https://www.volcengine.com/product/yunque
BuboGPT:多模态模型,结合文本、图像和音频输入的大型语言模型,具备视觉定位能力 → https://bubo-gpt.github.io
Boximator:视频编辑模型,根据文本提示,生成视频中的动作
PixelDance:结合图像和文本指令,生成复杂场景视频的模型 → https://makepixelsdance.github.io
MagicVideo:集成多个模块的 AI 视频生成框架,生成高审美价值视频 → https://magicvideov2.github.io
AnimateDiff-Lightning:文本到视频快速生成模型,提升视频生成速度 → https://huggingface.co/ByteDance/AnimateDiff-Lightning
ResAdapter:图形生成模型,生成任意分辨率和宽高比的图像 → https://github.com/bytedance/res-adapter/?ref=aihub.cn
SDXL-Lightning:文本到图像快速生成模型,生成高质量和高分辨率图像 → https://huggingface.co/ByteDance/SDXL-Lightning
扣子 / Coze:AI聊天机器人开发平台,支持快速创建、调试和优化AI聊天机器人 → 国内版 https://www.coze.cn;海外版 https://www.coze.com
🎨 应用层
豆包 / Cici:[AI对话平台] 基于云雀和GPT大模型的AI工具平台,提供聊天机器人、写作助手等功能 → https://www.doubao.com
小悟空 / ChitChop:[AI工具助手] 提供智能对话和辅助推荐功能 → 小悟空 https://wukong.com;ChitChop https://www.chitchop.com
猫箱 / AnyDoor:[AI角色互动] 用户可以创建AI角色并进行深度互动 → 猫箱 https://apps.apple.com/cn/app/%E7%8C%AB%E7%AE%B1-%E5%BC%80%E5%90%AF%E4%BD%A0%E7%9A%84-ai-%E5%A5%87%E9%81%87/id6475000292;AnyDoor https://www.anybagel.com
Dreamina:[AI图片视频应用] 辅助图片和视频创作 → 剪映 Dreamina https://dreamina.jianying.com;CapCut Dreamina https://www.capcut.com/ai-tool
星绘 / PicPic:[AI图片应用] 创建AI世界的分身并定制效果 → 星绘 https://apps.apple.com/cn/app/%E6%98%9F%E7%BB%98/id6475072892;PicPic https://apps.apple.com/ph/app/id6475074973
即创:[AI创意生产] 智能创意生产与管理平台,满足创作需求 → https://aic.oceanengine.com
海绵乐队:[AI音乐创作] 音乐创作工具,引入AI能力协助创作 → https://apps.apple.com/cn/app/id1620738933
河马爱学:[AI教育平台] 专为中小学生设计的AI教育平台 → https://www.hippolearning.cn
Gauth:[AI学习助手] 海外AI学习助手,提供拍照搜题服务 → https://www.gauthmath.com
识典古籍:[AI文化公益] 古籍数字化阅读平台 → https://www.shidianguji.com
MarsCode:[AI编程助手] 对标Replite做AI代码生成 → https://www.marscode.com
2. 采访了100多名创始人,我们发现 AI 对企业的影响,已经无处不在
Hampton 是美国一个会员社区,有大量的企业家、创始人和 CEO。最近,Hampton 邀请了 100 多位企业创始人,调研他们个人和企业是如何使用AI的,以及对业务发展带来了哪些影响。
以下是调研问卷的核心数据洞察:
35% 的企业为AI设立了专门的研发预算,其中 65% 的预算超过了10万美元,尤其以金融、生物技术和 SaaS 行业的研发预算最高。37% 的创始人表示,AI影响了自己公司的员工数量。创始人们有意识地避免在以下场景中使用AI:客户和个人数据、人力资源、创意工作。89.6% 的创始人正在使用AI,或致力于在其业务中实施AI。
报告探讨的话题以及呈现都非常有意思!以下是报告详细讨论的话题,如果有感兴趣的 part,可以前往星球获取完整版报告 (资源编码【R257】)
各行业使用AI的情况分析AI在企业中的普及度不同收入规模企业的AI采纳现状AI对企业员工规模和招聘策略的影响AI影响最显著和最小的企业角色创始人有意识避免使用AI的业务领域AI研发预算定制工具与第三方工具的对比企业正在使用的AI工具清单创始人及其团队正在使用AI工具清单AI在营销和内容创作中的应用AI带来的可量化的业务影响
3. AI 解梦靠谱吗?学界目前进展如何?未来有哪些靠谱的产品方向?
这是一篇「学术气质」超级浓郁的分析文章,围绕「AI + 梦」讨论了很多话题,比如解梦的科学研究方式和结论、梦境可视化、梦境&深度学习&对大脑的解析、商业化方向和比较知名的产品等。⋙ 阅读原文
咱们重点关注最后一个部分,一起探索下「如何用AI更好地理解做梦」这件事。
梦境的内容归因于大脑对白天收集信息的处理和整合。或者说,梦境提供了对我们潜意识深处的一瞥,揭示了隐藏的欲望、恐惧和情绪。
方向1:基于梦境进行对话。随着大模型等技术的兴起,出现了很多声称能够通过对话解析梦境的AI助手,还有一些宣称结合了中医典籍。对于可能存在「伪科学」嫌疑的研究,应该持有批判的审视态度。
方向2:梦境记录,比如苹果平台的 PlotPilot。我们对梦境的记录往往出现在刚睡醒或半睡半醒间,并且很大比例的梦境会在我们醒来后消失,一个好的记录工具就显得尤为重要。
方向3:帮助用户进入且稳定在清醒梦中,比如美国初创公司 Prophetic 开发的一款名为 Morpheus-1 的新型AI模型,以脑电活动为提示词,基于多模态大模型生成与该大脑状态相互作用的形状声波。
4. 6000字超详细复盘!南京 AIGC 城市宣传 MV 全流程制作解析
最近 AI 社区最火爆的创作复盘,应该就是 白马少年 这份南京城市宣传 MV 的详细流程解析了。从最终成片来看,创作者在工作流中融合了很多 AIGC 工具和技术。⋙ 阅读原文
根据创作者的分享,以下复原了整个创作流程,并整理了作者用到的 AIGC 工具,以及想实现的操作效果。
文案创作
工具:360浏览器的字幕提取功能、Kimi、GPT效果:提取和分析参考文案,创作符合特定风格的文案
歌词创作
工具:GPT效果:根据提供的文案改写为歌词,并为歌曲取名
歌曲创作
工具:suno (音乐创作平台)效果:通过提示词创建纯音乐和带歌词的歌曲
分镜创作
工具:midjourney (画面生成)、Stable Diffusion (字体设计)、deforum (转场效果)效果:生成有歌词部分的画面,进行无歌词部分的字体设计,以及制作转场效果
字体设计
工具:Stable Diffusion、controlnet (图像控制工具)效果:结合南京各区特色,进行字体的创意设计工具:DALL·E3 (构图绘制)、midjourney (画面美感生成)、sref和cref (风格统一命令)效果:绘制构图,生成美感画面,统一风格
视频制作
工具:runway (视频编辑工具)效果:对图生视频进行详细控制,制作动态视频
转场制作
工具:deforum (转场效果制作)效果:制作瞬息全宇宙效果的转场,实现图像之间的过渡
高分放大
工具:Topaz Video AI效果:提高视频分辨率和帧数,使视频更流畅
剪辑合成
工具:剪映 (视频编辑软件)效果:进行视频合成,按照音乐节奏摆放片段,添加转场特效和字幕
5. 天工优质科普文:一文看懂 MoE 混合专家大模型
最近半年,各种 MoE 大模型层出不穷,比较有名的既有 OpenAI GPT-4、谷歌 Gemini、Mistral、马斯克xAI Grok,还有国内 天工、Minimax、DeepSeek 等。
天工官方公众号这篇文章,就非常清晰地了 MoE 技术原理 & 优缺点,并解释了它能成为「当红炸子鸡」的深刻原因。
文章写得非!常!好!没有那些云山雾罩的术语和公式,用环环相扣的逻辑、平实朴素的问答,就把 MoE 解释得非常清晰。不愧是官方出品吼 👍 ⋙ 阅读原文
6. DeepSeek 发布全球最强开源 MoE 模型,官方大佬在知乎说了 5 点
4月17日,DeepSeek 发布了新版大模型 DeepSeek-V2,并大声喊出了「全球最强开源MoE模型」,引发了AI社区一波大震荡。👆 上图可以看到,DeppSeek-V2 的价格,便宜到全球独一档,让人看得惊讶又高兴 😱😁
今天 DeepSeek 官方大佬 @罗福莉 现身知乎,给出了 5 点非常重要的信息。⋙ 知乎问答
单论 DeepSeek-V2 模型的中文水平,是真实处在国内外闭源模型的第一梯队 (GPT4、文心4.0等) 。因为没做 RAG 等功能,所以实际在官网的体感没那么惊艳,但这不妨碍API效果!外加1元/百万输入Tokens的价格,只有 GPT-4 价格的1/100,性价比之王!
怎么兼顾模型效果和成本?基本纯靠:模型结构创新 (MLA + DeepSeekMoE) + 超强Infra。MLA 妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA。从今天起,放弃 MHA/GQA,全面拥抱 MLA 吧。同时,不严谨来说,DeepSeekMoE 也算是开启了「共享expert+细粒度expert分割」的 sparse 框架风 – 完全不同于 Mixtral MoE 的做法。简而言之:创新力就是第一生产力!
我们坚持了一贯朴实无华、真诚直接的开源风格,技术报告、模型权重、vllm推理代码都开源了。希望聚集开源社区智力,加速AGI时代到来。
未来还会持续给大家带来更惊艳的开源模型 (希望有机会可以“明目张胆”的说超过了GPT4-Turbo),所以大家不用担心模型断更,也不用担心API涨价 (目前就是大规模服务的价格,不亏本,利润率超50%)。
DeepSeek 团队的每一个人都非常优秀,DeepSeek-V2是群体智慧的结晶,创始人也是我坚信的国内最适合技术驱动型创业的!以及,最重要的,非常期待同样对AGI充满好奇心和创新力的各类人加入 (技术&非技术都需要)。
7. 2024 年巴菲特股东大会:AI影响力堪比原子弹,但人类对 AI 的未来知之甚少 (全文5万字)
5月4日,一年一度的伯克希尔股东大会在美国小镇奥马哈重磅开幕。在股东大会上,巴菲特先后谈到了已故老搭档芒格、减持苹果、AI影响、现金储备、接班人、投资比亚迪等热点问题。
在长达 5 个小时的会议中,有 2 处提到了人工智能和生成式AI。日报将巴菲特的核心观点总结如下。感兴趣可以根据关键词,检索并 阅读原文。
① 巴菲特:我对人工智能一无所知,但人工智能对世界的影响力堪比原子弹
AI的诞生很像当前的「核技术」。短期内加速了历史进程,但长期看却有很多负面和风险因素。我们不可能让「已经从瓶子里跳出来的精灵」再回到瓶子里了,只能在当下慎重决策。AI对未来的影响,毫无疑问是巨大的。但是这个影响很难被具体评估,只能让它自然而然地发生。我对此一无所知。
② 伯克希尔哪项业务在AI面前风险最大
任何一个劳动密集行业都会受到AI威胁。AI带来的一大好处,就是能释放部分劳动时间,帮助提升工作效率、拿到更多结果、减少流程损耗。有了更多时间的人类,可以参与更多的娱乐活动。但是,匆忙实施AI,可能会带来不可控的社会影响。例如社会的劳动力分配是一个复杂的机制,并不是效率越高越好。可能我们还需要仔细分辨,哪些任务交给AI是合适的。现在预言这些为时尚早。我也不认为当下的各种预测是正确的。
8. 苹果财报电话会议,库克看好苹果的AI前景,但是具体信息啥也没说 (全文1万字)
5月3日,苹果今日发布了 2024 财年第二财季业 。财报发布之后,苹果首席执行官 Tim Cook 、首席财务官 Luca Maestri 出席了财报电话会议,在解读第二财季财报的同时,回答了华尔街分析师的提问。 ⋙ 阅读原文
其中有2个问答与AI有关,但是有效信息不多。问答要点如下 (emmm 库克回答的艺术):
问:人工智能将如何带动苹果的营收增长?
库克:生成式AI和AI都将给我们的产品带来巨大的机遇。我认为苹果处于有利位置。我们将在接下来的几周内详细讨论。
问:苹果的人工智能战略,将同时面向消费者和企业,还是有先后顺序?
库克:苹果在第二财季以及之前的几个财季中,一直专注于向企业销售硬件设备。我认为苹果在企业市场,包括全球的企业市场,都拥有巨大的机会。
◉ 点击 👀日报&周刊合集,订阅话题 #ShowMeAI日报,一览AI领域发展前沿,抓住最新发展机会!
◉ > 前往 🎡ShowMeAI,获取结构化成长路径和全套资料库,用知识加速每一次技术进步!
下一篇: 【IT资讯速递】清华大学推出 D-Bot,用 AI 大模型协助管理数据库;ChatGPT 与 Stack Overflow 的对决;免费在线AI工具LeiaPix:一键将图片转3D动画
本文标签
ShowMeAI | 字节AIGC模型&工具大清单;AI解梦靠谱吗?AI MV制作手册;一文看懂MoE混合专家大模型;DeepSeek发布全球最强开源MoE模型
声明
本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。