【Coze保姆级笔记】怎么让AI自动生成资讯海报图
在信息爆炸的时代,制作资讯海报图成为了许多社群运营和内容创作者的日常任务。然而,这一过程往往耗时且需要多人协作。本文通过详细的实操步骤,介绍了如何利用 Coze 平台和 AI 技术实现资讯海报图的自动生成。
相信很多人跟我一样,都会加各式各样的社群。特别是一些垂直领域的学习社群,管理员每天或者每周固定时间,会在群里发布一张重要资讯的海报图。(如下图所示)
如果纯人工,制作一张新闻速报,往往需要阅读多篇的新闻,然后筛选内容,编写文案,再进行排版设计。从人员角度可能涉及到文案还有平面设计师。从时间角度,如果按照读一篇新闻2min,筛选提炼出5条新闻文案,大致耗时半小时,套用固定版式设计大概也要半个小时到一个小时左右,这还是不考虑其他影响因素及人员都是熟练工的前提下。
像这类的新闻资讯收集,一般都是比较模式化的,对于文案的要求和画面设计的精美度往往要求不高,但是对于产出的时效性要求较高。由此我在想,是否可以通过 workflow(工作流)实现让AI直接制作此类的资讯速报。
下面的笔记是我使用Coze平台的实操笔记和经验总结:
一、方案的思考
开始正式设计工作流之前,我们要先要理清三个问题:what、where、how
首先,解决我要什么的问题。参考各大社群中常见的新闻速报画面,大致会包含三大板块:时间、配图、文案。根据我希望呈现的内容,我大概规划出下图的这个版式,还有各字段的大致取值规则。
确定了最终要实现的目标,接下来要拆分成子目标和具体事项:
二、详细设计步骤
步骤1:创建工作流
Coze平台-工作空间-资源库,新建工作流,输入名称和工作流描述。
步骤2:添加检索插件
要进行关键词检索,可以直接添加[插件]节点,在插件库中可以直接选择扣子官方的头条新闻插件。这里也可以根据实际需求调整成其他的插件,只要链接成功率高还有插件描述符合使用场景即可。
步骤3:信息筛选与提炼
就像我们平时使用搜索引擎检索内容时候,通常也需要过滤信息,筛选信息一样。插件可以根据关键词输出很多内容,但是这并不能直接使用。所以此处需要插入[大模型]节点,进行信息的筛选与重新整理提炼。
这里我的筛选规则,分为几个维度:
- 时间维度,我希望选出的内容距离当前时间点,近1周的新闻。
- 媒体维度,我希望排除掉一些个人用户或者用户名乱码、娱乐营销号的信息,保留官方权威媒体的报道。
- 标题维度,我希望筛掉一些无意义的标题党。
因为上一节点插件会通过关键词检索出多条信息,所以这里大模型我们需要选择批处理的模式。也因为我们后续需要大模型通过时间进行判断筛选,所以我们需要给大模型添加一个获取当前时间的插件能力。
在系统提示词这部分,可以按照“角色+技能+限制”的格式来写。
“角色”是告诉大模型它的定位,比如是一个写作专家,新闻处理专家等。
“技能”则是你具体要大模型执行的事项也具体的规则,比如你要它按照什么规则筛选新闻,要按照什么格式整理输出内容。
“限制”则代表你希望它不要做的事情,比如不要输出媒体名称或者是不要偏离新闻内容等等。这里的提示词按照你实际的要求和你设计的业务逻辑进行匹配,没有唯一的答案。但是注意要在提示词中用{{}}来引用输入大模型的变量,这样是为了告诉大模型到底要怎么处理这个变量。这里大模型因为是批处理的模式,所以默认输出的内容是一个Array集合的格式,所以可以在大模型之后添加一个[文本处理]的节点,这个节点主要是为了整理大模型输出的文字内容使用的。这里[文本处理]节点的输入的变量直接引用为大模型输出的内容即可。
步骤4:新闻配图生成
完成了上述步骤,新闻的文字内容已经整理好了,接下来需要让AI生成配图。
AI生成图片需要提示词,生成的配图希望跟新闻内容是相关的,所以这里可以再添加一个[大模型]节点,让它专门来写配图的提示词。将它与上一节点的[文本处理]节点相连,输入变量引用为[文本处理]节点输出的内容。提示词让它根据{{input}}的变量,生成配图提示词即可。这里的提示词还是可以遵循“角色+技能+限制”的格式。
- “角色”可以直接定义它是一个图片提示词生成专家。
- “技能”部分可以写明你的详细要求,比如定义生成画面的画风、生成的图片提示词要根据所提炼的新闻内容、背景或者色彩等等对于画面的风格。
- “限制”可以写明要画面避免生成的内容。
这里有个小技巧,如果不知道要怎么描述画面的画风等等,可以先在各类图片网站找到你想要的风格,然后发给豆包,要求它根据画面反向输出生成提示词。
然后再添加一个[图片生成]的节点,直接引用大模型生成的提示词生成AI图片。这里为了保证出图的效果,是建议选择“通用Pro”的图片生成模型,并且把生成质量拉到最高。(不过消耗的Token也相应会增加,如果是免费版会有额度的限制)。在图片生成节点的提示词处直接引用输入的变量即可。
步骤5:生成金句
这里需要再添加一个[大模型]节点,让它专门负责结合前面整合好的新闻文案,撰写一句金句。这里我在实验时候发现,有时候大模型为了更契合新闻内容,金句会杜撰或者改编,所以在这里的提示词部分,我在限制部分特别写明了,要求它要列明出处,并且不允许它改编或者拼凑名言。
步骤6:时间格式整理
再来回顾一下我们需要的时间信息,包含了:①公历时间,按照YYYY/MM/DD的格式输出;②星期时间,按照星期几输出;③当前的农历时间。要获取这些时间数据,首先要知道当前的时间,这点大模型没有办法直接做到,所以这里需要添加一个[插件]节点,在插件库中选择“获取当前时间”的插件,将它和开始节点连接,这里不需要添加输入变量,直接连接即可,插件就可以输出当前的时间节点。
有了当前时间还不够,还需要有日期时间和农历时间,所以这里需要再添加[插件节点],在插件库中选择合适的万年历插件,查看插件的描述,它可以实现将当前时间转化为农历时间和星期时间。下图框选的部分是我添加的插件,这里添加了两个是因为单个万年历插件输出的信息不够全。这里将插件与上一节点获取当前时间的插件链接一起,将输入变量引用为上一节点输出的时间。
虽然通过添加万年历的插件,已经可以实现时间格式的转化,但是插件输出的信息内容还达不到直接引用的地步,所以这里还需要再添加一个[大模型]节点,专门负责格式的整理。
步骤7:元素排版设计
完成以上6步骤,我们已经获得了:金句的文案、新闻的文案、新闻的配图、整理好的时间。接下来要将这些元素进行组合排版。这里需要添加[画板]节点。
先将前面的节点与画板节点连接。然后选中画板节点,在元素设置中添加上要在画面上呈现的所有变量信息,并设置好对应引用的内容。
然后双击画板编辑板块。先设置画板的尺寸,这里可以直接选择预设好的比例,也可以自定义比例,也可以选择画板的底色。然后在画板的工具栏,通过文本编辑、插入图片、绘制矩形等工具,在画板画面中进行设置。要动态变化的文本和图片,可以设置引用变量。
步骤8:工作流的测试运行
完成以上7大步骤,工作流基本配置完成了,下图是我配置完成的工作流全局视图。接下来点击“试运行”,测试结果。
下图是我输入了“美股”这个关键词后,工作流生成的资讯海报图。
确认工作流可正常运行后,点击右上角“发布”。
步骤9:配置智能体
为了更加方便地使用,我们可以配置一个智能体。在工作空间-项目开发,选择创建智能体。
在中间技能模块中,在插件栏添加一个获取当前时间的插件;在工作流栏添加我们上述配置好的工作流;在左侧编辑智能体的提示词。
如果想要实现让智能体每天固定时间帮我自动生成海报。这里可以创建一个定时触发器。
完成之后,在右边输入进行智能体测试。
运行成功,可以点击“发布”,选择发布的渠道,提交审核,审核成功后,即可发布。
三、试验总结
写这篇文章的目的并不是为了像某些平台的所谓“专家老师”,包装出噱头,为了卖课。我只是想通过实践总结分享我的经验,也希望各位大神能够讨论交流,是否工作流/提示词设计的不合理,或者还有哪些更好用的工具分享。所以欢迎大家通过留言或者公众号【笛仁杰聊AIGC】与我交流。 以下几点是我总结的实践难点:
1、实用场景有限
虽然我花了大量的时间进行研究测试调优,并且最终它看似也能成功根据你输入的关键词生成海报,但是我还是得实实在在地说,它离真的能用还有一定的差距。一方面是版式受限于节点,它还没有办法做的很美观,只能用于固定的版式,对于视觉要求不太高的场景中。还有就是AI提炼的内容和生成的图片还有很多不确定性(下文中会举例说明)。
2、插件能力的限制
现在Coze平台的插件主要还是API调用,我在挑选插件时候,发现真的能用的很少,有的插件看似能输出很多的东西,但是你会发现压根都没有你能用的。因为很多是个人作者写的插件,一些传入参数都没有明确的指导,所以压根不知道怎么用。还有一些情况是好不容易看描述找到合适的,但是插件的调用成功率极低,也没办法使用。
3、AI生成文本的不可控性
以下图的“今日佳句”举例,尽管我在提示词中已经写明禁止改编并且不要输出分析的内容,实际测试的过程中,还有很多次回出现它自己改编佳句或者输出了很多分析的内容。
4、AI生成图片的不可控性
尽管在配置过程中选择了Pro的图片生成模型并且将图片质量拉到最大,并且已经在图片生成提示词中写明了限制,但是实际使用时,还是无法避免有时候画面中会生成一些乱码的字符(如下图所示)。同时在测试一些可能敏感的关键词时,大模型有概率会生成失败(我在测试“关税”这一关键词时,有一次生成失败了,我查看了错误代码,显示内容被服务器禁止了)
5、画板编辑的局限性
在编辑画板时候,还很不便捷,比如缺少文字排版中很重要的“两端对齐”功能;比如选中多个目标,没办法实现对齐。插入图片的时候,会默认显示1:1的尺寸格式,没有办法根据我实际图片大小生成视图,致使要花大量的时间根据生成的效果,再反复调整字体的大小,图片和文字的间距。
附录:资源消耗情况
因为工作流的业务逻辑并不算很复杂,所以工作流中配置的是豆包的工具调用模型和1.5·Pro·32k模型,下图是调用模型和插件对应消耗的数值,仅供参考。总得来说充值1块钱,个人也可以使用很久了,花费上还是可以接受的。
本文由 @笛仁杰 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
感谢分享!案例对小白很友好。能否提供一下“系统提示词”这部分的文本呀
这个海报生成的智能体已经发布在扣子平台的项目商店中,可检索“资讯海报制作”体验。https://www.coze.cn/store/agent/7491579258284965939?from=store_search_suggestion&bid=6fu46iu986g12