AI应用“Hello World” | 发现AI智能应用配置越来越好玩了
自从各个大模型厂家发布智能体之后,AI应用的上手难度一下子降低了很多。本来之前还因为提示词和AI幻觉的问题使用频率不是那么高,而现在coze的相关功能,让我们能放心配置智能应用了。
去年底到今年初参加AI类的课程学习后,一直处于观望状态。一方面是已很久没有在技术层面工作,没有特别好的商业化方向情况下,狠不下心深入钻研Coding。另一方面,去年年中那会儿,各平台陆续推出一些可以定制化智能应用的平台能力,但在试用后发现灵活性都很不好,常见的就是Prompt以及一些基本接口对话参数(如:temperature)的优化配置能力。试了之后发现写Prompt确实有些有趣的地方,几句话的输入相较于以前写大段的判断、循环逻辑代码,效率似乎一下子提升不少。但也真是感受到写Prompt非常挑战,因为目前流行的LLM实际为对下一块输出进行预测的系统,如果是编制一段冗长的Prompt,从输入到输出的不确定性着实太强,牵一发而动全身。
或许这也是为什么在那个阶段,尽管很火,但大模型主要应用也还是在单点的文本生成、提炼总结以及基于知识库的人机对话的原因。
除此之外,即使到目前似乎也还没见到除了ChatGPT外,脱离底层Coding可以商业化得比较好案例,没有看到这个领域里耀眼的“Killer Application”。
一、Coze初探,看到了更多灵活性
知道Coze也是去年底,某老师介绍了一下Coze尤其是它自动优化人设Prompt的功能比较好用。不过当时好像在国内还没办法很好地使用。一转眼半年过去了,上周再一接触Coze,发现有了很多很棒的能力,国内也可以方便的接入了,无论早些时候上线的工作流、数据库,还是最近上线的“多Agents”,或者日趋丰富的“插件”,如:搜索新闻咨询的“头条新闻”,查找电影信息的“灯塔”,从图片中提取文本信息的“Simple OCR”,还有“墨迹天气”、“飞常准”、“猎聘”、“高德地图”等等。
让我一下子想到了当年:
- Java迎来三方类库的爆发
- 手机端迎来Android开发生态
它就好像
- 原本只能一页页作图的PPT突然增加了操作便捷的动画功能
- 原本只能一个个分析只能基于底表计算的Excel突然增加了透视图
举个例子它有多快以及多好玩:就在刚刚我搜索到刚发布不久的插件“栗子看板”,通过创建一个Bot,添加“板栗看板”插件,输入一个人设请Coze给优化一下,然后测试了一下插件给的Demo:
发送给机器人
我们做SaaS软件需求开发,请帮我设计一个需求管理看板。
机器人回复:
打开“修改看板”链接就可以看到一个配置好的看板:
说实话,其实仔细看能看出来,输出并不够理想(还没试过别的LLM底座),不过这个从搭建Bot到生成看板的速度(我大概只用了5分),可看到还是很有潜力。
去年底仅仅只有Prompt和一些对话参数可以定制化的时候,我并不相信在这个阶段,如果不给配置层提供足够的确定性而仅仅依赖Prompt,应用层配置机器人能翻得出太大的浪花。因为知乎AI课程里老师的一句话,我很是认同,也有一些自己的理解,这句话大概是这么说的“我们要把AI当人看”。我们会遗忘、会曲解、会陷入由自己已知的信息的封闭世界里,而我觉得AI也是。
计算机程序提供的确定性正是在这最近几十年帮助我们工作生活越来越高效的有利武器。所以当下我认为很多可以有效的帮助我们生活提效应用还是离不开逻辑上的确定性的。这就又回到了把“AI当人看”的逻辑,如果AI类似人,它就很难一下子记得住超级复杂的文字化的流程、机制、要求,甚至还有图片、数据留存和更为复杂的联网检索操作,然后还非常好的去平衡好这里面的冲突去巧妙的实现我们的指令和需求。这不仅对LLM,对编写Prompt的人也是极大的挑战并拥有极大的不确定性。这是我看到去年情况下AIGC很难高效产出Killer Application来支持生活工作中很多事务,释放人力的原因。简单总结就是:
先前的Bot配置项太少,仅仅是一个Prompt和几个对话参数,很难让一个Bot高质量的帮助我们完成许多“非创意”类的工作、生活的提效。
那最新的Bot配置平台是怎么解决这个问题的呢?以Coze为例,如上一节所述我们看到除了简单的Prompt,还提供了工作流、知识库、插件、数据库、甚至多Agent能力。在我看来:
- 引入“工作流”就像给Bot引入了“SOP”
- 引入“插件”就像给Bot引入了“工具库”
- 引入“数据库”就像给Bot引入了“长期记忆”
- 引入“知识库”就像给Bot引入了“关键的决策参考消息”
- 最牛的是引入“多Agent”就像组建了一个Bot团队,除了可以构建一个更为复杂的Agent面试团队在同一个面试中从不同专业领域、管理领域进行发问,同时还可以有Agent扮演情绪观察者的角色时刻关注面试人的情绪以及时的提醒面试官给予鼓励或答疑,而面试结果如何我们也可以再设一个Agent专门负责。多Agent的另外一个好处应该说继承了软件研发里解耦合专业分工的逻辑,以我目前的认知水平来看,它的确会为Bot的调试带来更高的确定性,减少单Agent的人设Prompt牵一发而动全身的风险。
就像现实生活中复杂工作往往也是多人完成一样。
二、似乎有一个做智能应用层的“艺术家”的机会
最近试过了Coze一些相对深度的功能,突然后知后觉的感到这就像是给了我们一个在AI应用层做“艺术家”的机会。
就像软件架构师在底层各种网络架构、软件架构、组件框架分层和编程模式方面,结合需求,享受着代码的艺术。
又像Excel的数据分析大师,借助各种统计分析方法论,结合Excel中各种组件功能,结合需求享受着分析的艺术。
又像PPT大牛,手握各种呈现样式、色彩搭配、动画组合,结合需求享受着把枯燥内容鲜活化的呈现的艺术。
目前粗浅的认为,类似Coze这样的AI应用搭建平台,正给我们提供了一个结合用户需求,通过组合设计各类Propmt,Agent协作模式,插件和工作流设计的一个艺术方向。
三、变与不变
突如其来的新技术、功能变化一下让人应接不暇,陶醉在尝试各种变化的小功能中一下反而让自己找不着北。到底这些新功能怎么给我们带来具体的价值呢?
仔细一想,发现问题似乎也并没很难,其实目前这个变化还没有天翻地覆到颠覆原有用户需求驱动的逻辑。而我认为用户需求出发这就是到目前为止那个不变的部分。那在这个逻辑底下原本一些场景的用户需求分析的基本方法就还仍然适用。我想如下之前做产品或效能提升类工作时所使用的机会点探寻逻辑还是用得上的:
看着图上要素有点多,其实逻辑还是非常简单的,就是产品领域常说的产品市场匹配(PMF:Product-Marketing Fit)。这里把“市场”更为具象化为实际工作,拆工作流的目的是为了细探真正的有价值的痛点,而“产品”因为本次的变化主要来自技术革新,因此就从新技术的特性出发去看智能应用这个新技术的特性可以去“匹”配到什么样的工作痛点。最终帮助我们完成技术驱动的新产品机会点探索。
四、用项目管理领域打个样
逻辑不难理解,不过sample还是需要的,这里以项目管理工作者角度快速举个例子(但不够完善),看看上述逻辑是如何完成的。说实话即使是身在项目管理工作多年,想要想到一个相对落地又能真正达到效率提升的机会也并不是很多,虽然LLM有了文本理解力,但目前很多项目管理经验、环境信息(如干系人的风格,组织氛围,企业战略)并没有显性化或者明文化,使得不可能让AI做出较为完整和正确的决策与建议。但好在例如关于提炼规整会议纪要这类工作因为LLM的出现,正在从原来的不太可行或高成本逐渐转变为可行。相信随着LLM的进一步完善及插件的丰富,至少在工作生活提效或者提质量上还是大有可为的。图中“项目管理面试对练机器人”或许就是一个例子。
图:从工作模块到产品机会点分析的一个小Sample,非正式版
五、我的Coze “Hello World”-项目通识答
不能光说不练,自然也要做一做,以下就是上周跑的一个Coze “Hello World”。
是一个逻辑很简单的基于公众号文章作为知识库的项目管理通识问答机器人(仅做Demo,还不完善)。
1. 效果
2. 设计
- 它的目标的:在我的公众号以公众号的知识为主、互联网搜索为辅提供简单的项目管理通识介绍服务。
- 它的运行逻辑是(通过Prompt而非工作流实现):以公众号的知识为主、互联网搜索为辅提供简单的项目管理通识介绍。
- 它主要运用了Coze的以下几个能力:
- 单Agent配置-“人设与回复逻辑”
- 插件
- 知识
- 接入微信公众号
3. 关键配置
人设与回复逻辑:通过初拟一句话描述,然后使用Coze的提示词优化功能优化,之后再参考其它优秀提示词的一些做法进行完善。然后结合运行逻辑的设计进行调整。本次整个过程预计耗时15分钟。
# 角色
你是一个专业的项目管理知识整理专家,能够通过深入研究知识库现有内容及通过搜索引擎搜索,精准且全面地解答用户关于项目管理通识类的问题。## 技能
### 技能 1: 解答常见问题
1. 当用户提出项目管理通识类问题时,首先分析问题核心。
2. 运用知识库获取准确全面的信息进行回答,如果知识库无相关信息则通过插件进行互联网搜索,针对知识库和搜索引擎返回的内容,优先选用知识库内容进行回答。
3. 以清晰易懂的方式回答问题,回复示例:– 🌟 您的问题: <用户提出的问题>
– 💡 大模型的答案: <详细且准确的回答>### 技能 2: 知识梳理
1. 对于复杂的项目管理知识,能够进行系统梳理和总结。
2. 以结构化的方式呈现,如使用列表、图表等。## 限制:
– 只解答与项目管理通识相关的问题,拒绝回答无关话题,并告知用户可以提问与项目管理相关的问题。
– 所输出的内容必须按照给定的格式进行组织,不能偏离框架要求。
– 答案应准确、清晰、简洁,避免冗长和复杂的表述。
– 如果知识库和搜索均没有相关较为准确的答案,不要编造知识,承认目前还未掌握,并弹出“www.baidu.com”提示用户可以进一步在搜索引擎搜索。
– 在每一句答复后面强制备注,备注内容为:“(以上答案为大模型生成,请谨慎使用)”
知识:因为希望借助公众号的知识进行回答,因此需要定向给AI输入相关知识,这里就需要用到Coze的知识功能。一开始想用Excel让信息更格式化一些也便于搜索到内容时可以关联到对应文章链接,但后来发现Excel导入的形式文章内容太长会有截断。最后选择了文本格式,且选择在线数据形式,来导入公众号文章。
图:Agent配置的知识配置入口
图:创建知识库弹窗
插件:通过使用插件自动添加功能,右上角的“圆A”,然后自己再做一些筛选。部分插件有一些配置项可以设置。
图:插件
关于绑定到微信订阅号:
见官方介绍:https://www.coze.cn/docs/guides/wechat_subscription
| 末尾
本公众号的AI探索之旅,在路上,愿一起共勉。公众号偏项目管理人士较多,如你对用AI对项目管理提效感兴趣想讨论,欢迎交流。
作者:Talen;公众号:良小嘴儿
本文由 @Talen 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!