从工具到Agent：我们正失去「停止权」

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

从工具到Agent：我们正失去「停止权」

赛博禅心

2025-03-29

0 评论 2209 浏览 3 收藏

随着人工智能技术的飞速发展，Agent（智能代理）作为一类具有自主决策能力的AI系统，正在从理论走向实际应用。然而，Agent的广泛应用也带来了新的挑战和风险，尤其是在其自主性和人类控制权之间的平衡问题上。本文从OpenAI关于管理自主AI系统的讨论出发，深入探讨了Agent在实际落地过程中面临的七大难点问题，供大家参考。

之前参加了一场 OpenAI 的活动，主题是管理「自主 AI 系统」（Agentic Systems）。

那时聊了很多有关 Agent 的问题，恰是当下各种 Agent 项目正需面对的。

讨论多是基于论文《Practices for Governing Agentic AI Systems》，地址是：https://openai.com/research/practices-for-governing-agentic-ai-systems

明确一下：

OpenAI 会面对这些挑战，并非是其水平不行，而是更早的开始探索边界。

— 大家都将会遇到

有关 Agent

Agent 的定义，目前已经严重泛化了：两个人在讨论「Agent」，他们讨论的可能都不是同一种东西。

按当前的语境，我们会把 ChatGPT 就是看成一种 AI 应用，它能理解你的问题并给出回答。而会把 GPTs 这种订制后的、能调用外部功能的、能够自己处理复杂任务的产品，叫做 Agent。

Agent 和 AI 应用（如ChatGPT）之间的区别和联系主要体现在“代理性”（agenticness）。如果一个AI系统，能够在没有直接人类监督的情况下运作，其自主性越高，我们称之为代理性越强。这是一个连续体，不是非黑即白的判断，而是根据它在特定环境中的表现来评估其代理性的程度。

B端究竟需要什么样的产品经理？

B端产品经理都是以提升供应侧的工作效率为目的，所以B端需求主要是以业务问题为导向。这个是B端产品比较重要的一点，B端产品是服务于一个主体 ...

查看详情 >

在这种定义下，正统 Agent 不仅能回答问题，还能自己决定做什么，它能够通过生成文本来“思考”，然后做出一些操作，甚至能创造出更多的 AI 帮手来帮帮忙，就比如下面这个图。（仔细看这个 Twitter 图，时间是 2 年前）

（再补一张2年前，时任 OpenAI Dev Rel 的 Logan 的发言）

但我们发现，尽管 Agent 看起来很美好，但在实际落地的场景中，也是困难重重，风险多多，出现了问题，责任划分也很麻烦。比如这里：如果我希望让某个 Agent 帮我微信收款，但它给别人展示的是付款码，那么这里谁背锅？

这些问题，也将会是 o1 在真正行业落地时，所要面对的。

落地难点

由于会上的 PPT 不便分享，我便在自己吸收后，重新制作了一份 PPT，安心食用

01 执行效果评估

在商业环境中，确保任何工具的可靠性是基本要求。

然而，AI Agent 的复杂性在于其工作场景和任务的不确定性。例如，一个在模拟环境中表现优异的自动驾驶车辆，可能因现实世界中不可预测的变量（如天气变化和道路条件）而表现不稳定。

我们尚缺乏有效的方法，来准确评估 AI Agent 在实际环境中的性能。

02 危险行为界定

AI Agent 在执行高风险操作之前需要获得用户的明确批准。例如，在金融领域，AI 执行大额转账前必须得到用户同意。

但需要注意，频繁的审批请求可能导致用户出现审批疲劳，从而可能无视风险盲目批准操作，这既削弱了批准机制的效果，也可能增加操作风险。

03 默认行为确定

当 AI Agent 遇到执行错误或不确定的情形时，是要有一个默认行为的。例如，如果一个客服机器人在不确定用户需求时，其默认行为是请求更多信息以避免错误操作。

然而，频繁的请求可能会影响用户体验，因此在保障系统安全性与保持用户体验之间需要找到平衡。

04 推理透明展示

为了保证 AI Agent 决策的透明性，系统需要向用户清晰展示其推理过程。举例来说，一个健康咨询机器人应详细解释其提出特定医疗建议的逻辑。

但如果推理过程太复杂，普通用户可能难以理解，这就需要在确保透明性和易理解性之间找到平衡。

05 Agent 行为监控

假设一个 AI 系统用于监控仓库库存，如果监控系统误报，误认为某项商品缺货，进而不断的进货，那么可能导致库存的严重积压，并造成极大损失。

于是，我们思考：是否需要另一个 Agent 来监控这个 Agent？成本账怎么算？

06 Agent 作恶追责

考虑一个匿名发布内容的 AI Agent，如果其发布了违规内容，要追踪到具体负责的人或机构可能极其困难。这种情况下，建立一个能够确保责任可追溯的系统尤为关键，同时还需要平衡隐私保护和责任追究的需求。

07 严重事故叫停

想象一个用于自动化工厂管理的 AI Agent，在系统检测到严重故障需要立即停机时，不仅需要停止主控系统，还要同步关闭所有从属设备和流程。如何设计一个能够迅速且全面响应的紧急停止机制，以防止故障扩散或造成更大损失，是一项技术和策略上的复杂挑战。

本文由人人都是产品经理作者【赛博禅心】，微信公众号：【赛博禅心】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

赛博禅心

拜AI古佛，修赛博禅心

28篇作品 100020总阅读量

手握7亿月活，支付宝依然做不好直播？

06-064347 浏览

关于GPT-4的产品化狂想

03-2610670 浏览

成功B端产品经理的年终总结秘诀：掌握这几个技巧！

刚刚

在“计划和目标”之外，寻找你的“踏脚石”

06-044922 浏览

东方甄选的面子和里子

12-25668 浏览

想做好品质外卖，抖音不能只靠流量

07-053081 浏览

目前还没评论，等你发挥！

UI转产品，跳槽涨薪30%，只用了90天，我是怎么做的

该让东方甄选降降温了

06-251988 浏览
Meta出走直播间，欧美难续直播带货神话

03-012197 浏览
揭秘短剧市场赚钱术：专为“保安保洁和保姆”定制，几十万撬动过亿回报

11-021290 浏览

专题

13902人已学习11篇文章

抽奖类活动的设计指南

抽奖作为一种活跃用户的运营手段之一，在产品运营的工作里是一项大家必须掌握的技能。本专题的文章分享了抽奖类活动的设计指南。

新媒体运营，多的是你不知道的事！

签到功能是培养用户习惯的好办法。本专题的文章提供了签到功能的设计指南。

本专题的文章分享了营销案例解析。

做了好多年的产品经理，该不会连注册登录功能设计都没整明白吧？

专题

15253人已学习14篇文章

B端交互设计指南

交互设计本质上就是设计产品的使用方式的过程，“如何才能做出合理的B端交互决策”是很多人都在思考的问题。本专题的文章分享了B端交互设计指南。

网站统计