造个Agent牛马帮我消化Super Boss的需求!【工作流基础速通篇】

3 评论 1543 浏览 4 收藏 24 分钟

在AI迅猛发展的当下,AIGC(人工智能生成内容)正在逐步渗透到各个商业场景中,但如何高效地利用AI提升工作效率,仍然是一个值得深入探讨的问题。本文开启了一套关于AI-Agent构建的系列连载,旨在帮助读者快速掌握AI工作流的基础搭建方法,并通过案例实战,探索如何为自己的工作场景构建实用的AI助手。

此次会连载一套AI-Agent构建的系列,主要分为三部分,首先是速通AI-Agent构建的工作流基础,然后是通过ComfyUI作为案例来复盘如何快速上手工作流平台,最后则是借助Agent平台构建一个AI Agent案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试思考为自己的工作搭建一些可用的AI助手,或是提供构建的方法指引。

无论你是产品经理还是设计师,你会发现商业场景的AIGC,几乎都没有办法通过一段需求描述或是简单的Agent对话就搞定的,你需要更专业更复杂的AIGC过程,那么如何理解复杂?实现专业?本系列会给你带来一些启示。

AI迅猛发展下涌现的AIGC

在过去两年不到的时间里,AI绝对是一个热门话题,同时带来的也是各种AIGC的尝试与数字化创新,我们迫切期望用AI来提升产出效率或带来新的风口,经过了两年的时间,风风火火的AI似乎又放缓了脚步,被AI冲击的人或事物好像也没有想象中那么多,但AI的进步或商业化应用的脚步确是有迹可循的,可谓是大模型小应用。

这两年里已经有越来越多的人或企业用上了大模型的问答、AI多媒体生成、智能体(Agent)、工作流,其中大模型是最为常见的,能够直接与用户进行多模态沟通,并给予解答。多媒体AI生成方面已经覆盖了图像、音频、视频等多领域,在广告营销方面大放光彩。而带有周期记忆的大模型配合一定的数据材料+工具就能训练出智能体,用作解决某些特定场景的问题和内容生成,在个人助手或企业服务中有着广泛的应用;至于工作流则作为构建智能体或特殊AI工具的特定形式,被渐渐带入AIGC广泛的视野中。

过去的两年里,专业的智能体平台也在迅速发展,并且有数以万计的智能体被发布使用,其中字节的扣子是知名度最高的,其次还有百度的文心智能体平台、支付宝的百宝箱、Dify、Link AI等,他们的出现均是为了便于我们构建自己的智能体助手或是特定工作流。

大模型开发或训练对普通人比较难,但在这个AI迅速发展的时代,我们不妨站在巨人的肩上,思考一下从个人工作提效的视角,如何来构建自己的智能体或是工作流?

Agent与AI工作流的区别

AI Agent (AI 代理)

其实AI Agent并不是这两年才出来的概念,一般资料会说是一种能够感知环境、进行决策和执行动作的智能实体‌。其实你可以浅显的理解成是一个有记忆力,能够学习指定资料和调用程序工具来完成任务的AI代理助手,所谓的感知环境就是能够接收用户的指令或是通过传感器采集数据,然后大模型会根据指定资料学习来的知识,调用工具来自动的实现用户目标或优化收集到的数据,并且会在每次执行优化过程中学习提升,说到底一个AI Agent是否好用,还要看AI大模型是否牛掰,以及喂的知识库是否专业可靠,也因此带出了如RAG这些知识库索引技术,目的就是为了让AI更高效准确的从知识库获取信息,这个有机会再深入吧。

AI Workflow (AI 工作流)

当你在考勤程序上提交了一条请假,AI助理判定你的请假理由合理就自动转达给老板进行最终审批了,那么这套介入了AI的数字化审批流程就可以看成是AI Workflow。浅显的理解就是一条搭载了各种AI模型或工具插件的数字化生产流程,可以根据需求将数据不断的加工执行得到我们最终想要的结果,他们由一系列数字化插件与AI模型根据明确的任务次序组成,每个步骤都有清晰的输入和输出规范,整个流程高度结构化且可预测,同时也是大多复杂Agent或智能工具编排开发不可绕开的一种形式,工作流编排能够有效地管理和协调这些插件或AI,确保Agent能够高效、可靠、精准地运行。

两者的优势差异

AI Agent

借助大模型(LLM)的智慧与学习能力,Agent有更强的理解分析与自主决策能力,能够更好的适应复杂的场景与信息处理,并且可以根据过往的数据进行深度学习和优化提升,适合相对开放的业务场景输出,但灵活开放的同时,也会带来一些不可控或未知。

AI Workflow

则更注重人为预定的执行路径和标准化的生产流程,可控性强,结果可预测,效率高,有一定扩展性,适合处理结构化、重复性任务,AI或大模型主要担任其中的内容加工与数字化资产生成相关,但同时工作流本身就是一套流程自动化的方法,应用场景也相当广泛。

职场打工就是人肉工作流

你是否发现,大部分职能工作都有自己的一套流程和方法论,就像是做饭得有菜谱一样。这些流程和方法论能让我们更快更好地完成生产工作,当然捏,时不时的我们也会根据需求适当的调整一下流程或是方法嘛,就好比说客人跟你将喜欢吃辣一点,那么我们就适当的多加一些辣椒🌶️。

倘若你是数字化办公,那些结构稳定重复的作业不就妥妥的一条工作流嘛,因为工作流是代码或程序背景条件下的自动化办公流程,那么我们把一些工作事项整成一个个工作流让AI来完成!是不是!对,恭喜你也获得一头赛博牛马~

那么先让我们从工作流开始吧,掌握复杂AI-Agent构建的底层思维,教你如何一步步搭建自己的赛博牛马。

速通工作流,原来如此简单

AI工作流的概念我们已经清楚了,那么正式聊聊工作流的结构与搭建思路~

工作流的基本构成

工作流目标

这个工作流的用途价值(相当于老板下达的需求目标)

起点终点

任务的起点设置与最终的交付结果(相当于老板提出的需求到执行结果)

节点

构成完整流程的局部阶段或是事件单位,它们通常由一个或多个任务构成(相当于一个产品研发组织中的小部门,如设计部、产品部)

任务

用作完成和实现节点目标的各个最小运行任务单位(相当于小部门接到需求后,拆成若干小任务开始分工,然后根据任务要求开始标准执行输出)

连接

用作编排各个任务节点关系或步骤的“药引子”(相当于产品部输出“PRD”连接设计部,设计部输出“UI”连接研发部,用作规范内容输入输出的字段参数,最终得出老板要的结果)

条件

用作控制各个任务节点连接的条件判断,即准入准出(相当于设计任务完成后需要给设计总监看一下是否合格,是一种严格执行和标准化的体现)

赛博餐厅上线,带你速通工作流

首先我们用一套虚拟的数字化餐厅的菜品制作流程来演示一遍工作流是如何搭建和工作的,背景是在一个专业数字化的制菜工作流平台,并且有着丰富的任务插件或AI工具可用;

目标背景:流程目标是电子菜,因为是虚拟的工作流制作,所以有一些节点或任务不会特别细致,就像是在玩游戏一样,不要太在意哦~

  • Step1. 首先流程的起点是点菜(菜名数据),最后是上菜(菜品结果)
  • Step2. 根据预设,我们将配菜作为第一个节点,主要是找到插件或AI完成菜品的食材配置
  • Step3. 接着是备菜节点,这个节点里的任务会根据菜品将食材进行清洗配切准备
  • Step4. 然后是烹饪节点,这个节点里的任务主要是完成调味跟烧菜
  • Step5. 烧好菜了,你知道的,我们要装盘~
  • Step6. 最后!当然是上菜啦~

此时我们已经得到了一套电子菜的基本生产流程了,流程里已经有了关键节点或是任务,并且有一套可行的线性关系编排,用来保证节点任务之间能够有序运行,这些很重要,不信你看看我这套流程~

我想你一定会吃的很开心,连我的盘子碎片一起嗦溜吧hhhh

好啦,那么让我们继续将节点关系和条件正确地完善起来 ⬇️⬇️⬇️

这个时候我们已经有一套简易的工作流结构了,但,让我们再完善一下“节点的任务”跟用于连接节点任务的“字段数据”看看~

目前为止,我们已经清晰了基本流程,并且规范了连接关系与任务插件或AI的选用编排,他们已经大致能够将顾客下单的菜名逐步加工成目标菜品了,这些任务插件或AI模型都是平台提供的,总之他们能搞定自己对应的任务,厉害的模型甚至能一次搞定多个任务,当然了,这些程序模型或插件的底层或背后也可以是这样一套工作流,只要你规范好其运行的输入输出条件或结果,然后封装成一个固定的插件单元即可。

那么接下来以“配菜”节点为例,我们将任务1插件背后的工作流再一次的剖析看看,究竟有哪些节点或任务构成。

到这里一套工作流的构建我想你应该心里有数了,这些节点任务的接口就像是电子积木一样,我们设计好流程、数据与条件,将任务插件正确连接起来,保证接口数据能够通过起始参数一步步的变成最终所需的结果即可。

任务或节点的典型结构

你可能在想,一个AI Workflow这样就可以了吗?还不够,对于实际节点任务的连接关系我得再补充一下。

细心的你一定已经发现了些特征,这些单元是不是特别像一个电子元件或是函数?是的,以开发视角来看,他们就是一堆模型接口,配置好输入字段参数请求接口,然后接口根据输入条件进行运算并输出预期的结果。

你要是还不能理解就把单个任务或是节点看作一个人,把米饭跟火龙果吃进去,然后拉出红色的翔,输入是米饭+火龙果,经过一顿消化,输出是红翔~

因此他们具备输入、输出、参数配置三大结构特征,参数配置就是输入数据的条件设置,可以是多个不同类型的设置,可以控制最终输出结果的走向,相当于对前面那个吃米饭+火龙果的人进行条件要求,要求他多吃几个火龙果,这样就可以获得更红的翔了~

当然了,也有些简单的插件单元只用作单一的输入或是输出任务,甚至可以直接执行,不需要进行手动的参数配置。

另外一个单元的输入输出参数可以是多对多关系,例如前面那个吃饭+火龙果的人,他输入到肚子里的就是多个类型的食物,最终输入的除了红翔其实还有液体哦 [暗中观察]

然后再说说输入输出的数据类型,这些数据通常由字段(参数名)+具体参数+数据格式构成,例如“姓名:泡泡”中,姓名就是的字段,泡泡就是字段的参数,参数类型就是个中文字符串,若是“年纪”这个字段,那么参数的类型基本就是数值。

还记得前面赛博餐厅的例子吗,在现实里,每个节点任务之间的输入输出也具备以上三个属性,就像下面图里例举的一样,【配菜】的输入字段是菜名,参数则是一个具体的菜品名称,类型则是传递这个信息的一个载体,例如便签;

所以在真实的AI工作流构建时,同样也需要注意到这些字段的格式类型,他们被用作规范输入输出的数据格式,例如输入一段文本(类型是字符串),最终交付一张图像(类型是图像),这便是典型的文生图模式,这里我给一些高频的基础字段类型了解一下;

在前文提过,为了更准确的控制结果输出,就免不了一些参数配置,即使工作流平台提供了丰富的任务节点或是插件,但,我们仅仅只是围绕基础流程把他们组合连接一下是不够的。

在实际的工作流任务或节点应用时,还有很多的部分需要由设计者来完成字段参数的设定与配置,这样任务插件之间才能正确工作起来,就如下图这些头疼的玩意儿~

但也别急着头疼,通常这些玩意儿就是对应任务插件的预设配置而已,或者是AI模型工作的提示词,当你知道了任务节点的用途与条件后就不会难懂了,那么现在让我们在赛博餐厅的工作流中也展示一些必要的节点任务配置看看如何~

如图上所示,我们为“点菜”跟“装盘”节点补充了任务执行所需的字段参数配置,是不是也不难理解?

既然要求做任务执行,那么任务执行的标准或必要条件你肯定得通过字段参数的形式输入给任务插件了。

工作流扩展升级的思路

那么工作流仅仅就这样?别急别急!

我再讲一点点灵活扩展的方法思路,说到底工作流是一系列程序与数据交互,那么只要程序加工的插件或模型够丰富够智能,我们不就可以根据诉求鸟枪装成大炮哇!

还是我的赛博餐厅,既然是一家餐厅,那我们可得有特色了,所以我们应该有一套限定风味的菜单,而不是大杂烩,所以先上一个点菜系统;

这时我们就有一套预制的菜品菜单了,并且菜品图正是我们赛博餐厅里生产的,可不是网图哦~

接着考虑到要调用食材仓库,我们给制菜流水线再加一个食材分析节点,用作更好的采购和管理食材,并且增加一个用户反馈节点来改善菜品,那么开始操办~

目标一:食材采购管理

设计思路:每次配菜都会有一套食材表单,可以作为输入的基础数据,中间则添加一套AI模型,负责按照周月季不同的周期来整理和分析食材的用量存量趋势,以及保存周期规划,最终输出一套符合采购系统的数据表,使得食材仓库合理高效运行。

目标二:用户反馈优化

设计思路:首先需要收集到有效的用户反馈,其次要对应到菜品,以及我们期望的反馈,所以我们在上菜流程上扩展一个用户反馈节点来连接用户,并且借助AI设置一套符合我们赛博餐厅的菜品意见表,这个表是用户选填的,但是一定会在用餐结束后记录菜品名称与用餐结果图,当然,如果用户提供了反馈就更好了。

那么反馈结果呢?不要急,我们会通过指定的数据格式先输入到一个“菜品优化分析”的AI模型任务节点上,然后将优化结论输出到“配菜”节点中的“厨房小能手”AI模型上,以及烹饪节点中的烹饪方法知识库上,这样我们就可以得到优化后的烹饪菜品了。

那么这么一套赛博餐厅的工作流模拟搭建就告一段落了,其实只要有够丰富的插件或模型,还有你丰富的想象力,小小的积木也能被你搭建成豪华的城堡,希望这一套赛博餐厅下来,能帮你把流水线的概念与技巧吃透。

下一期,通过ComfyUI工作流作为案例教你如何快速上手工作流平台与搭建工作,为后续案例实践作基础巩固。

专栏作家

泡泡,公众号:即刻UX,人人都是产品经理专栏作家。专注产品交互领域的体验设计师,擅长思考和UI呈现设计,喜爱交流探讨~

本文原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 写的很好,期待后面的更新

    来自江苏 回复
    1. 感谢评论与支持,你是最靓的仔

      来自浙江 回复
  2. 凑条评论

    来自浙江 回复