爆火的AI Agent到底是什么？有了大模型为什么还需要AI Agent？

qq_33453797 2024-06-13 17:31:02 阅读 84

AI agent是AI与具体应用场景结合落地的一种方式，大模型需要agent来实现功能的扩展。

要想弄明白什么是AI agent，那么就要先弄明白什么是LLM(大模型)。

所谓的大模型就是实现AI(人工智能)的一种方式，但大模型本身没有实体，虽然经过大量是数据训练之后，其具备了一定的智能。

但是它就像人类的大脑一样，虽然你有了一个想法，但是怎么把这个想法具体的落地，也就是怎么把这个想法给做出来。

虽然说，现在的大模型可以生成一些文本，图片和视频；但这些功能毕竟是有限的，但AI的目标是为各行各业进行赋能。

比如，大模型虽然可以写一些简单的代码，但怎么让它独自完成整个系统的开发流程，从需求采集，产品设计，再到代码实现，以及测试上线整个流程的实现，目前大模型本身是没有这个能力的。

所以，这时就需要有个东西来帮助大模型把它的“想法”实现；而这就是AI agent。

AI agent 本质上是一个构建在LLM(大模型)之上的智能应用，也就是说AI agent是大模型的上层应用。如果说把AI比做一个人，那么大模型就是这个人的大脑，虽然它拥有了智能，但其却没有能够真正做事的实体。而AI agent就相当于人的手脚眼睛和嘴巴，以及各种人类能够利用的工具。

由上图可见，Agent由记忆，规划，工具，行动，四大模块组成。

记忆

记忆就类似于人类大脑的记忆功能，AI需要知道一件事怎么做，做的过程是什么样的，这就需要记忆功能。因为很多事情需要经过复杂的执行，复盘，再执行，再复盘才能成功。

记忆分为短期记忆和长期记忆，短期记忆就是上下文，长期记忆可以使用向量数据库。

规划

所谓的规划，主要由两部分组成，其一是思维链，其二就是目标分解。

因为现实中很多问题都需要经过复杂的流程去处理，所以做一件事之前需要先做个大体规划，这就是思维链；其次，就是要把整体目标进行分解成多个小目标或步骤；然后一步一步的执行。

就像做饭一样，首先要想好做什么菜，然后需要哪些食材，工具和材料；之后，还需要拆分，第一道菜是什么，第二道菜是什么；然后每道菜第一步怎么做，第二步怎么做。

工具和行动

所谓的工具就是，大模型本身只有思想，在处理不同的事情时，需要不同的工具；就像人一样，人想做饭的时候需要锅碗瓢盆，种地的时候需要镰刀铁锹，开发软件的时候需要开发工具，测试工具，服务器等。

而行动就是，把一件事情规划好之后，工具准备好之后，就可以去执行了；毕竟规划和工具只属于准备阶段，执行才是真正的落实阶段。

所以，Agent就有了下面的公式：

Agent = LLM(大模型) + 记忆 + 感知&反思 + 规划+ 工具使用

所以，Agent是基于LLM的加强，其具备规划和拆分目标的能力，并且根据执行结果进行自我优化和调整；因此，也有人认为Agent是实现AGI(通用人工智能)的一种方式。

总结

总结来说，大模型和Agent都属于实现人工智能的一种技术实现方式；AI是一个人，那么大模型就是这个人的大脑，Agent就是大脑指挥做事的工具集。

下面是本人公众号，分享关于AI技术及其应用场景，喜欢的朋友可以扫码关注。

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。