OpenAI的CEO都在谈的 AI Agent,到底是什么?
作为AI应用落地的方向之一,AI Agent这一概念受到了不少企业和从业人员的关注,那么,AI Agent究竟是什么?AI Agent又是如何开展工作的?不妨来看看本文的分析和解读。
为什么要了解 AI Agent ,因为投资者当前只关注 AI Agent公司,OpenAI 等 AI 前沿公司都在研究它。
AI Agent 是AI应用落地的一个方向。
创业圈有个玩笑话,我有一个很牛的idea,但就差一个程序员了。未来,AI Agent 就是帮你实现idea的「程序员」。
读完本文,你会理解 AI Agent 是什么,它是怎么工作的。
一、AI Agent 是什么
AI Agent是指人工智能代理(Artificial Intelligence Agent),是一种能够感知环境、进行决策和执行动作的智能实体。
举个例子,AI Agent 就像是一个小爱同学,住在你的手机或电脑里,有智慧和观察能力。
当你对它说:“小爱同学,我有点不舒服。”
它会像魔法一样,通过观察你的状态、体温,还有最近 24 小时的行动轨迹,并结合互联网上的数据和信息,通过一系列眼花缭乱的分析,在 1s 钟后得出结论,你「阳」了。
然后主动给你生成请假条,你点点头请假单就发给你 leader 了。
还贴心的告诉你,家里布洛芬和矿泉水已经不够了,已经帮你选好商品,只要你一声令下,30分钟后会送到家门口。
它感知到,现在开车并不是一个好的想法,就顺手把你回家的车也叫好了,10分钟后就到楼下,赶紧撤吧。
这就是一系列的 Agent 协同工作的结果。
二、这么优秀,它是怎么工作的
一图告诉你 AI agent 是怎么工作的。这张图描述了一个智能体如何处理、分析和响应外部信息的流程。
有点不太明白,是吧,那我来拆解下。
AI Agent 分为 4 个部分:
1. 感知(Perception)
- 这是流程的第一步。AI 通过传感器、摄像头、麦克风等,建立起对外部世界进行感知。
- 输入(Inputs):感知到的信息被输入到系统中。在这个例子中,输入是:“我有点不舒服”、我的体温、精神状态、睡眠时间等
- 外部环境(Environment):系统所在的环境或上下文。比如“我有点不舒服”这件事,会涉及到天气、环境(比如是不是在有花粉过敏的场所)等。
2. 信息处理(Agent的大脑(Brain))
可以说是通用大模型+N多知识库,用来处理信息。包含以下系统:
1)信息存储相关
记忆系统:包括 Storage 和 Memory ,用来存储长期和短期的数据。
比如长期数据是我这个人的基本信息、爱好、基础疾病等;
短期数据比如我家的矿泉水只剩下1瓶了,购买之后这个记忆就可以删除了。
知识库(Knowledge):包括医学知识库、商品库等,用来诊断我当前的状态,以及后续治疗、生活所需的管理。
2)大模型对信息进行处理
基于感知的信息(input + Environment )、记忆、知识库等信息,进行加工处理,得出结论(Decision Making):“我生病了,而且是「阳」了这种情况”。
3)然后制定下一步计划( Planning)。
Action/Reasoning 是基于其决策的具体动作,但还没有实行。
要帮我写好请假条、帮我买药、买水、叫车等。
3. 执行(Action)
基于 Barin 一系列眼花缭乱的操作,得出了结论,制定了下一步计划,那就需要执行(Action)。
大模型本身不能完成这些任务,需要调用外部的工具。
这时候就会用调用第三方的工具(Tools 和Calling API),通过接口或者应用,与其他App进行互动,达到最终效果。
4. 输出(output)
执行之后,需要一个出口,告诉你执行结果。比如我的小爱同学。它告诉你:“你阳了,已经帮你写好请假条、叫好车.”
以上就是AI Agent的工作原理。
总的来说,这个系统描述的是一个简化的模型,展示了是一个 AI agent 如何从感知信息开始,经过一系列内部处理和决策,最终做出响应的过程。
三、总结
AI Agent 是未来 AI 发展的方向之一(另外一个方向下篇写)。
它可以是私人助手,也可以是你工作的帮手,他能放大你的能力。补齐你的短板,让你成为超级个体。
本文由@产品浅谈 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
那,AI发展的另一个方向是什么呢?
谢谢分享,例子生动形象~好赞