全面解读Agent,前OpenAI高管+斯坦福顶尖学者综述
“探秘智能体,解读未来智能。” 在人工智能的前沿领域,智能体(AI Agent)正逐渐成为焦点。它究竟是如何构建的?又具备怎样的能力?本文将深入解读前 OpenAI 高管和斯坦福顶尖学者的综述,为你揭开智能体的神秘面纱,展现其在模拟人类行为等方面的巨大潜力。
(Lilian Weng定义的Agent结构图)
智能体(AI Agent)=大模型(LLM)+记忆(Memory)+规划(Planning)+工具使用(Tool Use)
LLM(AI大模型)是Agent的大脑,属于“中枢”模型,要求有以下3种能力:
planning skills:对问题进行拆解得到解决路径,既进行任务规划
tool use:评估自己所需的工具,进行工具选择,并生成调用工具请求
memory:短期记忆包括工具的返回值,已经完成的推理路径;长期记忆包括可访问的外部长期存储,例如知识库
斯坦福大学+谷歌顶尖学者发布的《Generative Agents: Interactive Simulacra of Human Behavior》中做了一个AI小镇,通过类似《模拟人生》的沙盒环境中里面内置了25个Agent。
用户可以观察并干预 Agent 规划他们的日常、分享新闻、建立关系以及协调团队活动。这篇文章要解决的问题是如何创建能够模拟人类行为的生成Agent,这些Agent可以在交互式应用中使用,例如沉浸式环境、人际交流排练工具和原型设计工具。
架构
这篇论文提出了一种生成代理架构,用于解决人类行为模拟的问题。具体来说,
记忆流:首先,论文描述了一个长期记忆模块,称为记忆流,它以自然语言形式记录代理的所有经历。记忆对象包括自然语言描述、创建时间戳和最近访问时间戳。
检索函数:为了决定代理的下一步行动,论文实现了一个检索函数,该函数根据代理当前的情况返回记忆流的一个子集。检索函数考虑了三个主要组件:
新颖性:最近访问的记忆对象得分较高。
重要性:代理认为重要的记忆对象得分较高。
相关性:与当前情况相关的记忆对象得分较高。
反思:其次,论文引入了反思的概念,这是一种更高级别的思维,由代理定期生成。反思通过将最新的记忆记录作为查询,并从语言模型中获取相关记忆来生成。
规划和反应:最后,论文描述了规划和反应的过程。规划描述了代理未来的行动序列,帮助保持行为的一致性。反应则是代理在感知到环境变化时采取的行动。对话生成则是基于代理之间的记忆来进行的。
实验
论文通过在一个类似《模拟人生》的沙盒环境中实现生成代理来验证其架构。具体来说,
环境:沙盒环境被称为Smallville,包含一个小镇,其中有25个独特的代理。每个代理由一个简单的精灵头像表示,初始记忆包括一个自然语言描述的段落。
用户控制:用户可以通过自然语言与代理互动,指定一个角色来感知代理。用户也可以直接命令一个代理,使其更像代理的“内心声音”。
环境交互:代理在沙盒世界中移动和与环境中的对象互动。用户可以改变代理的环境状态,例如将厨房炉子从“开启”改为“燃烧”。
结果
可控评估:在可控评估中,论文通过“采访”代理来测试其在自我认知、记忆、计划、反应和反思方面的能力。结果表明,完整的生成代理架构生成的行为最为可信,而移除某个组件后性能会下降。
端到端评估:在端到端评估中,论文观察了25个代理在两天内的自发行为。结果显示,代理之间形成了信息传播、关系建立和协调。具体来说,关于Sam市长竞选的信息传播范围从1人(4%)增加到8人(32%),关于Isabella情人节派对的信息传播范围从1人(4%)增加到13人(52%)。
总结
智能体(AI Agent)可以比喻为一部高效运作的智能机器人。这部机器人由以下几个核心部件组成:
大语言模型(LLM):相当于机器人的大脑。它负责处理和理解语言信息,就像人类大脑处理思考、理解和沟通一样。大语言模型使得机器人能够理解指令、回答问题并与人类进行流畅的对话。
记忆(Memory):相当于机器人的存储系统。它允许机器人记住过去的交互和经验,以便在未来的任务中加以利用。就像人类根据记忆来做出决策一样,智能体通过记忆来提高其处理问题的能力。
规划(Planning):相当于机器人的导航系统。它帮助机器人制定行动方案,以实现既定目标。就像我们在旅行前规划路线一样,智能体通过规划来确定如何执行任务。
工具使用(Tool Use):相当于机器人的双手。它使得机器人能够使用各种工具来辅助完成任务。就像人类使用工具来提高工作效率一样,智能体通过使用工具来扩展其功能,解决更复杂的问题。
所以智能体(AI Agent)就像一个具备高级认知能力、丰富经验、出色规划和实际操作能力的智能机器人,能够高效地完成各种复杂任务。
本文由人人都是产品经理作者【陈宇明】,微信公众号:【码个蛋】,原创/授权 发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于 CC0 协议。
- 目前还没评论,等你发挥!