2024年,搞AI就别卷模型了

CSDN 2024-08-04 13:01:02 阅读 89

你好,我是三桥君

2022年11月30日,OpenAI发布了一款全新的对话式通用人工智能工具——ChatGPT

该工具发布后,仅用5天时间就吸引了100万活跃用户,而在短短2个月内,其活跃用户数更是飙升至1亿,成为历史上增长速度最快的消费者应用程序!

什么概念?

就连国际版抖音TikTok达到1亿用户都用了9个月,而Instagram则花了两年半的时间。

想要深入了解AI,可以看我写的这篇文章:

《为什么要了解AI?突破》

Al曾经因为商业化的难题而受到外界的批评,但是随着OpenAl的ChatGPT的推出,它成为了搅动AI大模型领域的催化剂。突然之间,各种竞争者纷纷加入这场竞赛。

可以说就在一夜之间,AI大模型热得发烫。

百度率先加入战局,凭借“文心一言”抢占了与ChatGPT对标的“国内第一”位置,自此之后,大模型成为了市场的关注焦点。

特别是在那之后,各个领域的竞争者都开始全力以赴,迅速行动起来,密集地投入到这场竞争中,全力以赴地推动大模型的发展!可以说真的“卷”!

总之,大模型领域,彻底火起来了。

百度率先发起挑战,紧随其后的是阿里和商汤,它们都迅速跟进,并且是最为积极和迅速的,都已经推出了类似ChatGPT的产品。

以下是从2023年以来的一些大模型创业公司及产品:

复旦大学正式发布“MOSS”大模型

澜舟科技正式发布“MChat”

清华大学开启内测中英双语对话模型“ChatGLM-6B”

百度正式发布“文心一言”

商汤科技正式发布“日日新”

阿里巴巴正式发布“通义千问”

昆仑万维等正式发布“天工3.5”

科大讯飞发布了 “星火认知大模型”

美图正式发布视觉大模型“MiracleVision(奇想智能)”

华为正式发布“盘古大模型3.0”

字节跳动开始公测大语言模型“云雀大模型”

腾讯正式发布自研通用大语言模型 “混元”

......

可以说,在大模型领域,国内已经经历“百模大战”的时代了。

感兴趣的话,具体可以看我写的这篇文章:

《为什么要了解AI?风口》

三桥君认为,搞AI还是别卷大模型了。

为什么我会这么说呢?

因为群雄逐鹿,最后会是一将功成万骨枯。 胜利者,只是活下来的罢了。

这种战况局面让我联想到以前的“千团大战”。

在2010年至2015年期间,中国互联网领域经历了一场声势浩大的“千团大战”。这场竞争中,团购网站的数量从顶峰时期的5600家急剧减少至仅剩两家。在这五年的激烈角逐中,可以说美团才是最后的赢家。

训练大模型,成本非常高昂,动不动就上亿元起步,而且很耗能源。

训练大模型成本有多高呢?

2017年,训练一个基础的Transformer模型大约需要900美元。然而,到了2019年,训练一个RoBERTa Large模型的成本已经上升到了大约160000美元。进一步到了2023年,OpenAI的GPT-4模型和Google的Gemini Ultra模型的训练成本更是分别高达约7800万美元和近2亿美元!

不跟你开玩笑,训练大模型的成本是越来越贵~

训练大模型耗电有多高呢?

以GPT-3的训练为例,训练过程使用了大约128.7万度的电力。

该如何理解这个耗电量?

这相当于约6400户中国普通家庭一个月的电能消耗。有专家做过一个形象的比喻,这大致等同于3000辆特斯拉电动汽车同时行驶,每辆车行驶20万英里。

因此,三桥君认为,2024年,如果要搞AI还是别卷大模型了。除非你有这个资本去打持久战,否则大概率最后一地鸡毛。

也许我与大佬们在这件事上达成了共识。

2024年7月,知名大型AI峰会召开。其中,某大厂创始人站出来呼吁各位,“大家不要卷模型,要卷应用!

因为训练大模型真的耗钱耗能源,卷模型只会加剧。

那为什么劝大家卷应用呢?

因为将这些技术应用于实际场景,解决实际问题。就算没活下来,我认为至少给咱老百姓做贡献了,当福利了嘻嘻~

所以,AI的应用层应该会迎来一波小浪潮。如果你对AI应用感兴趣,可以学学这个内容。

《零基础开发AI聊天机器人》

欢迎订阅课程专栏:

《零基础开发AI聊天机器人》

 



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。