从关键新闻和最新技术看AI行业发展(2024.6.17-6.30第二十六期) |【WeThinkIn老实人报】

Rocky Ding* 2024-07-18 14:31:03 阅读 91

写在前面

【WeThinkIn老实人报】旨在整理&挖掘AI行业的关键新闻和最新技术,同时Rocky会对这些关键信息进行解读,力求让读者们能从容跟随AI科技潮流。也欢迎大家提出宝贵的优化建议,一起交流学习💪

欢迎大家关注Rocky的公众号:WeThinkIn

欢迎大家关注Rocky的知乎:Rocky Ding

AIGC算法工程师面试面经秘籍分享:WeThinkIn/Interview-for-Algorithm-Engineer欢迎大家Star~

获取更多AI行业的前沿资讯与干货资源

大家好,我是Rocky。

阅读Rocky创办的《WeThinkIn老实人报》,大家能够获得:

掌握AIGC传统深度学习以及智能汽车这三个AI行业核心方向的最新进展,能在评论区抒发观点,共同学习交流。找到让自己灵光一现的关键新闻和最新技术,这对我们的职业生涯非常重要。理顺国内AI行业头条新闻全球AI行业头条新闻AI产业链融资新闻以及AI技术进展头条新闻四大板块,降低我们对未来下一个核心价值(OpenAI式公司和AIGC式技术)的错判率

本文是《WeThinkIn老实人报》的第二十六期,Rocky本次梳理的周期为2024年6月17号-2024年6月30号。在本期中,Rocky会毫无保留地分享自己的核心观点,希望能给大家更多思考。

So,enjoy:

正文开始

目录先行

读前大局观国内AI行业头条新闻全球AI行业头条新闻AI产业链融资新闻AI技术进展头条新闻

读前大局观

Rocky将工业&科技分为三个维度:

尖端工业&科技:包括新能源、AI、航空航天、军事工业、半导体、新药研发以及细分高精尖行业等。中端工业&科技:包括汽车、高铁、大飞机、大轮船以及已经突破的曾被宣称是“尖端工业”的产业。基础工业&科技:包括房地产、基建以及轻工业等基础制造业和基本生活用品业等。

我们目前的发展阶段,首先要解决的是中端工业&科技的市场占有率问题,需要占据全球市场的80%左右,并留下识大体顾大局的20%的海外公司共同成长,共享发展果实。

在基础工业&科技,目前主要是处在降本增效,持续优化的状态。基础工业&科技包含了人们的衣食住行,是跨周期的、市场巨大的产业,依旧有很多机会。

在尖端工业&科技方面,拿AI行业为例,我们目前主要是跟紧世界最新趋势,问题不大的。从AI行业的政策、资本、产品、意识等都飞速迭代的当下,国内AI行业的产品落地与弯道超车能力依旧非常强。 此外像新能源、航空航天、军事工业等领域,已经进入与全球伙伴合作的阶段,市场上留下的更多是识大体顾大局的海外合作伙伴。

国内AI行业头条新闻

AIGC产业新闻:

1、金山办公重磅发布WPS AI海外版,应用亚马逊云科技生成式AI技术。

2、四川长虹发布基于AI大模型的智慧家电AI平台“长虹云帆”,以及搭载云帆平台的国内首款8K高刷Mini-LED电视产品。

3、百度文库宣布新产品“橙篇”行业首创10万字长文生成及多模态编辑能力,成为行业首个“查阅创编”一站式AI自由创作平台。

4、阿里云推出首个AI程序员:具备架构师、开发工程师、测试工程师等岗位技能,最快可“分钟级”完成应用开发。

5、腾讯旗下AI大模型应用“腾讯元宝”升级AI搜索及解析能力:可支持单文档最长1000万字的超长文处理,能够一次性解析最多50个文件。

6、快手视频生成大模型“可灵”再度进化,正式推出图生视频功能及视频续写功能。

7、科大讯飞:将于6月27日发布讯飞星火大模型V4.0,全面对标GPT-4 Turbo。

8、零一万物Yi-Large等系列大模型正式登陆阿里云百炼平台,首次通过云厂商提供API服务。

9、百度智能云千帆推出大模型普惠计划,文心旗舰模型首次免费。

10、商汤科技宣布推出大模型0元购计划,将赠送5000万Token包。

Rocky观点:“AIGC时代的大规模补贴来了,这让Rocky想起了移动互联网时代。”

11、微盟发布面向企业客户的AI应用产品“WAI Pro”,探索企业级AI市场机遇。

12、钉钉宣布对所有大模型厂商开放,构建中国最开放AI生态。

13、科大讯飞宣布推出“讯飞星火API普惠政策”,星火Lite版本永久免费。

14、字节跳动发布基于豆包大模型打造的智能开发工具“豆包MarsCode”,面向国内开发者免费开放。

Rocky观点:在进入2024年后,从大模型本身延伸到相应的细分领域,形成ToC、ToB和ToG三个非常大的机会点。和2023年不同的是,大模型的发布数量明显减少了,进入了大模型迭代优化与大模型之间厮杀的阶段。

新能源产业新闻:

1、欧洲eVTOL制造商Lilium亚太地区总部落址深圳宝安,携手领跑低空经济。

2、一加冰川电池沟通会官宣6月20日举行:一加携手宁德新能源共同打造,号称“高性能手机电池技术里程碑”。

3、科大讯飞与智元机器人签订战略合作协议,共同探索人工智能技术在人形机器人领域的创新应用。

4、高德地图面向汽车行业发布AutoSDK 750,升级车道级导航5.0、多场景车道级安全预警等多项功能。

5、中国电信成立低空经济产业联盟,并发布“低空领航者”行动计划。

6、懂车帝:未来一年将投入8亿元现金和1000亿流量,扶持优质汽车内容产出。

Rocky观点:新能源行业的发展所催生的电动车行业与新制造业,是跨周期的。加上互联网思维,相信可以和特斯拉一起形成合力,让最后存活下来的海外车企们更加识大体、顾大局。

传统深度学习&芯片产业新闻:

1、华为云华东(芜湖)数据中心正式开服,华为云全国存算网枢纽节点布局全面完成。

2、高德地图携手中安联成立“智慧交通应用联合实验室”,科技力量守护货运安全。

3、神州数码与映云科技签署合作协议,加速AI时代的数据解决方案落地应用。

4、京东宣布已完成鸿蒙原生应用核心版本开发,即将在华为应用市场上架。

5、华为:截至目前鸿蒙生态设备已超过9亿台,HarmonyOS开发者人数超过254万,持续为亿万消费者带来创新体验。

Rocky观点:“国产替代领域是一个非常实际的产业,有很大的机会,同时为了防止卡脖子,也是非常有必要的一个产业。”

6、华为宣布推出开发者布道师计划:未来3年内发展3000名布道师,推广鲲鹏、昇腾、鸿蒙、华为云等生态。

7、高德地图登陆原生鸿蒙,地图导航领域首家支持跨终端服务。

8、华为发布AI入网“开城计划”,第一阶段将赋能1000名站点工程师、管理超过10000个站点。

9、华为全国首个数字服务创新中心落地成都高新区,助力发展新质生产力。

互联网产业新闻:

1、蚂蚁集团发布可持续发展报告:重投科技普惠,2023年研发投入211.9亿元。

2、蚂蚁集团创新科技总部大楼在北京海淀挂牌,预计7月底启用。

3、微博转发功能全新升级:字数上限扩展为500字,超级会员用户优先开放。

4、拉勾招聘正式上线出海招聘板块,中国企业加速出海。

Rocky观点:“出海是必须的,全球市场的蛋糕必须进行攫取。”

5、360公司在天津成立中小企业扶持中心,助力企业数字化转型。

6、钉钉回应出海:确有相关布局,已服务数百家中资企业出海场景。

商业基本面新闻:

1、2023年度国家科学技术奖励名单公布:共评选出250个项目,华为、比亚迪、科大讯飞等公司获奖。

全球AI行业头条新闻

AIGC产业新闻:

1、OpenAI组建国际游说团队,全球事务团队人数已增至35人。

Rocky观点:“全世界有人的地方,就有人情世故,就有合作要疏通。”

2、亚马逊云科技宣布推出安全服务新功能,为生成式AI加上“安全锁”。

3、英伟达开源Nemotron-4 340B(3400亿参数)系列模型,可生成合成数据用于训练大型语言模型(LLM)。

4、亚马逊AWS宣布向全球初创公司提供2.3亿美元,以加速生成式AI应用程序的创建。

5、Spotify推出其首个内部创意机构Creative Lab,将开始测试生成式AI广告。

6、“炒掉”AI点餐员,麦当劳叫停与IBM合作的自动点餐测试项目。

7、软银据悉将与人工智能搜索引擎初创公司Perplexity AI开始战略合作。

8、三星电子与首尔大学共同成立人工智能联合研究中心,致力于推进先进AI技术的研究项目。

9、谷歌在印度推出AI聊天机器人Gemini移动应用,提供英语和9种印度语言版本。

10、环球音乐集团宣布与人工智能技术公司SoundLabs合作。

11、Adobe更新服务条款,重申不会使用用户作品训练AI。

12、OpenAI拓展医疗保健领域,与Color Health合作探索使用GPT-4o模型创建AI工具Cancer Copilot。

13、OpenAI竞争对手Anthropic宣布推出Claude 3.5 Sonnet,为其迄今为止性能最强大的AI模型。

14、甲骨文:将在西班牙人工智能和云计算领域投资超过10亿美元。

15、谷歌DeepMind创新AI技术,可为视频自动生成配乐和对白。

16、软银集团创始人孙正义:新一轮投资将致力于打造“超级人工智能”。

17、OpenAI收购企业搜索和分析初创公司Rockset,帮助客户筛选数据。

18、因担心数字市场法影响,苹果今年不会在欧盟市场推出人工智能技术。

Rocky观点:“为了能够培育欧盟自己的科技公司,欧盟一定会给美国科技行业使最大的绊子的。虽然欧盟中充斥着美国的走狗,但是一些残存的真正的欧洲人是不会放弃任何一个反抗机会的,因为这是真正的欧洲人必须做的。”

19、英伟达将在中东五国数据中心部署AI技术,首次在当地大规模推出产品。

20、OpenAI将采取额外措施,停止其不支持的国家和地区的API使用。

21、OpenAI宣布其首款适用于Mac的ChatGPT聊天机器人应用正式面向所有用户开放下载。

Rocky观点:全球的AIGC行业发展都非常迅速,我们需要紧跟AIGC行业的最新进展,将先进的技术工具化,同时思考关键产品的逻辑。

新能源产业新闻:

1、安森美推出最新第7代IGBT模块,助力可再生能源应用简化设计并降低成本。

2、美国电动汽车初创公司Fisker在特拉华州申请破产保护,预计负债1亿至5亿美元。

3、安森美拟投资20亿美元扩建捷克芯片厂,以扩大碳化硅产能。

4、京瓷将投100亿日元扩大电池产量,将家用蓄电池产量翻倍。

5、西门子能源获得沙特阿拉伯15亿美元电站订单,总装机容量近4吉瓦。

6、谷歌旗下自动驾驶汽车公司Waymo宣布向所有旧金山用户开放无人驾驶出租车服务。

传统深度学习&芯片产业新闻:

1、三星整合存储芯片、代工和封装提供一站式服务,加快交付AI芯片。

2、三星发布半导体技术路线图:引入尖端晶圆代工技术,加强AI芯片生产“一站式”服务。

3、微软拟在西班牙投资71.6亿美元建新数据中心,预计将在10年内完成。

4、SK海力士大幅扩产第5代1b DRAM,以应对HBM及DDR5需求增加。

5、亚马逊计划在德国投资100亿欧元,以扩展物流网络和云基础设施。

6、三星电子计划大力投资GPU领域,以推动其半导体工艺创新及AI研发。

Rocky观点:“三星有想法是好的,但是美国不会允许的,虽然三星已经是美国公司,但只要对英伟达等美国公司有一点点的威胁,会进行及时的收割,这是必然的。”

7、亚马逊北美最大规模淘汰塑料填充气袋,快递盒改用纸质回收材料填充。

互联网产业新闻:

1、YouTube与北美在线杂货平台Instacart达成合作,将推出全新购物广告功能。

2、微软宣布启动“安全未来计划”,网页版Outlook用户将于6月30日开始无法再访问其Gmail收件箱。

3、欧盟将对苹果公司采取进一步措施,确保App Store和iOS遵守《数字市场法案》。

4、聊天软件鼻祖ICQ正式停止服务,即时通讯先驱结束28年使命。

5、三星官宣将于7月10日在法国巴黎举办Galaxy Unpacked发布会,Galaxy Z Fold6/Flip6折叠屏手机将登场。

商业基本面新闻:

1、英伟达总市值3.34万亿美元再创历史新高,超越微软、苹果成为全球市值最高公司。

AI产业链融资新闻

Rocky观点:《WeThinkIn老实人报》将从投资视角与长期主义出发,挖掘初创公司的势能与机会点。

1、消费级NAS存储产品及软件服务提供商“冰鲸科技”完成数千万元Pre-A+轮融资。

2、中高阶智能驾驶解决方案提供商“轻舟智航”完成数亿元C轮融资。

3、AI儿童教育产品研发商“柯南AI”完成数百万元天使轮融资。

4、3D ToF芯片和解决方案提供商“光微科技”完成数千万元新一轮融资。

5、氢能重卡运输运营服务商“荣程新能集团”完成超5000万元Pre-A轮融资。

6、多模态大模型研究和开发商“智子引擎”完成超千万元Pre-A轮融资。

7、多模态大型机器人研发商“银河通用”完成7亿元天使轮融资。

8、AI驱动药物递送和药物发现企业“剂泰医药”完成1亿美元C轮融资。

9、实时互动边缘云服务商“庭宇科技”完成数亿元B轮融资。

10、原生3D生成AI服务商“DreamTech”完成数千万元天使轮及天使+轮融资。

Rocky观点:等过了2年、3年、5年甚至10年,再回过头来打开本期文章,看看里面的初创公司是飞速成长,还是已经消亡,就能体会到时间的意义。

AI技术进展头条新闻

Rocky观点:《WeThinkIn老实人报》将从工业界出发,以投资、CEO以及CTO视角挖掘技术发展的落地可能性与明星技术的潜力。

1、文生视频大模型Gen-3 Alpha重磅发布!

6月17日晚,Runway在官网发布了全新文生视频模型——Gen-3 Alpha。

与Gen-2相比,Gen-3在生成视频的质量、色彩、饱和度、光影、文本语义还原、运镜、动作一致性、场景切换等实现大幅度提升。

gen-3视频效果

Gen-3 Alpha官方地址:https://runwayml.com/blog/introducing-gen-3-alpha/

2、潞晨Open-Sora开源大升级:可以生成单镜头16秒720p高清视频!

文生视频界的开源战士——潞晨Open-Sora在720p高清文生视频质量和生成时长上实现了突破性进展,支持无缝产出任意风格的高质量短片。

在这里插入图片描述

开源地址:https://github.com/hpcaitech/Open-Sora

技术报告地址:https://github.com/hpcaitech/Open-Sora/blob/main/docs/zh_CN/report_v3.md

3、谷歌推出V2A,可为视频大模型自动匹配语音!

谷歌Deepmind在官网推出了视频转音频模型V2A。用户可以用视频+文本提示的方式,通过V2A为视频模型自动匹配语音,进一步节省制作时间和提高效率。

在这里插入图片描述

官方地址:https://deepmind.google/discover/blog/generating-audio-for-video/

4、Claude 3.5 Sonnet正式发布,号称代码能力超GPT-4o!

6月20日晚,Anthropic在官网正式发布了Claude 3.5 Sonnet。

据悉,Sonnet是Claude 3.5系列中第一个,也是Anthropic目前最强的视觉模型,其代码生成能力以及新引入的可视化“Artifacts”功能,是目前代码生成领域最强的大模型之一。随后Anthropic还会发布Haiku和Opus版本。

官方试用地址:https://www.anthropic.com/news/claude-3-5-sonnet

5、阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位!

6月27日凌晨,开源平台huggingface的联合创始人兼首席执行官Clem在社交平台宣布,阿里最新开源的Qwen2-72B指令微调版本,成为开源模型排行榜第一名,中国在全球开源大模型领域处于领导地位。

Qwen-2开源地址:https://huggingface.co/Qwen/Qwen2-72B-Instruct

6、谷歌开源Gemma-2:同类小参数大模型中性能最佳之一!

6月28日,谷歌宣布开源最新大模型Gemma 2。Gemma 2一共有9B和27B两种参数,与上一代相比性能大幅度提升,但部署要求却大幅度下降,只需要一块NVIDIA H100 Tensor Core GPU或TPU主机就能使用。

在同类小参数大模型中,Gemma 2超过了Llama-3 8B等大模型,性能逼近Qwen1.5成为同类最佳模型之一。

开源地址:https://www.kaggle.com/models/google/gemma-2

在线使用地址:https://aistudio.google.com/app/prompts/new_chat?model=gemma-2-27b-it

7、Stable Diffusion XL核心基础知识,从0到1搭建使用Stable Diffusion XL进行AI绘画,从0到1上手使用Stable Diffusion XL训练自己的AI绘画模型,AI绘画领域的未来发展等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Stable Diffusion XL文章地址:https://zhuanlan.zhihu.com/p/643420260

8、Stable DiffusionV1-V2核心原理,核心基础知识,网络结构,经典应用场景,从0到1搭建使用Stable Diffusion进行AI绘画,从0到1上手使用Stable Diffusion训练自己的AI绘画模型,Stable Diffusion性能优化等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

Stable Diffusion文章地址:https://zhuanlan.zhihu.com/p/632809634

9、ControlNet核心基础知识,核心网络结构,从0到1使用ControlNet进行AI绘画,从0到1上手构建ControlNet高级应用等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

ControlNet文章地址:https://zhuanlan.zhihu.com/p/660924126

10、LoRA系列模型核心基础知识,从0到1使用LoRA模型进行AI绘画,从0到1上手训练自己的LoRA模型,LoRA变体模型介绍,优质LoRA推荐等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

LoRA文章地址:https://zhuanlan.zhihu.com/p/639229126

11、最全面的AIGC面经《手把手教你成为AIGC算法工程师,斩获AIGC算法offer!(2024年版)》文章正式发布!

码字不易,欢迎大家多多点赞:

AIGC面经文章地址:https://zhuanlan.zhihu.com/p/651076114

12、10万字大汇总《“三年面试五年模拟”之算法工程师的求职面试“独孤九剑”秘籍》文章正式发布!

码字不易,欢迎大家多多点赞:

算法工程师三年面试五年模拟文章地址:https://zhuanlan.zhihu.com/p/545374303

《三年面试五年模拟》github项目地址(希望大家能给个star):https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer

13、Stable Diffusion WebUI、ComfyUI、Fooocus三大主流AI绘画框架核心知识,从0到1搭建AI绘画框架,从0到1使用AI绘画框架的保姆级教程,深入浅出介绍AI绘画框架的各模块功能,深入浅出介绍AI绘画框架的高阶用法等全维度解析文章正式发布!

码字不易,欢迎大家多多点赞:

AI绘画框架文章地址:https://zhuanlan.zhihu.com/p/673439761

推荐阅读

1、《三年面试五年模拟》面试秘籍

《三年面试五年模拟》面试秘籍旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。

Rocky已经将《三年面试五年模拟》面试秘籍的完整版构建在Github上:https://github.com/WeThinkIn/Interview-for-Algorithm-Engineer/tree/main,欢迎大家star!

《三年面试五年模拟》面试秘籍的内容框架

想要一起进行项目共建的朋友,欢迎点击链接加入项目团队:《三年面试五年模拟》版本更新白皮书,迎接AIGC时代

3、其他

《WeThinkIn老实人报》的第二十六期就完整展现在大家面前了,未来引领AI科技浪潮和变革的要素可能就在其中,每个给本文一键三连的朋友,一定会挖掘到属于自己的机会点!

最后,希望在AIGC时代中,大家能和Rocky一起,飞速成长!



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。