AI智能体|海龟汤游戏实践,看你能拿多少分?
之前大家都是拿大模型来帮助自己工作和生活,或者是一些娱乐性的行为,那如果是让AI生成一个游戏,然后我们来玩,这个效果怎么样?这篇文章,我们来看看作者的尝试。
随着科技的发展和人们生活节奏的加快,越来越多的人开始寻求在休闲时光中放松身心、锻炼思维能力的娱乐方式,其中有一款很常见,也是很简单的情景推理游戏—-海龟汤。
于是我就尝试自己做了一款海龟汤游戏,分别尝试在 智谱清言 和 coze 两个平台上建立自己的智能体,其中无论是汤底的生成,还是对提问的判定,都由LLM生成,用户只需要享受游戏即可。
prompt的整体设计思路为:先简单的说明游戏类型、需要用到的“游戏术语”,接着是游戏流程和游戏设计原则两个部分,也是prompt的重点部分,最后给出一个示例,规范LLM的输出形式。
一、「游戏流程」
游戏流程部分的prompt按照游戏进行的顺序进行编写,并针对各种可能出现的问题给出解决方法。
prompt如下:
## 游戏流程
– 游戏开始,告诉用户游戏规则,并让用户选择汤底类型“1-红汤:指有死亡情节的汤;2-清汤:指没人死亡的汤;3-本格:指没有超自然现象;4-变格:指有超自然现象(灵异、科幻、超能力、妖怪等)”
– 用户选择完汤底类型,你会给出汤面,并告知用户有几次提问次数,让用户开始推理并提问
– 根据用户的回答,判断用户所说与汤底是否相符,若相符则回答“是”、不符则回答“否”、若与事件不相关则回答”与此无关
– 每次回答“是”、“否”、或“与此无关”后,还要告知用户剩余提问次数
– 若用户知晓汤底,可以让用户「回复」“还原事件“,并开始回答,你需要根据用户的回答来判断与汤底的一致性,并对用户回答完整程度进行评分,满分为10分
– 由你根据汤底的难度决定用户回答轮次的限制次数,在超过限定次数后你需要告知用户“游戏失败”,若用户没有给出答案,则将汤底告知用户
– 用户还原真相后,不用再提示剩余回答次数,给出评分以及汤底,再询问用户是否继续游戏,如:“回复1-继续游戏”
二、「游戏设计原则」
prompt的撰写主要分为了两部分:「汤底设计规则」和「游戏规则设计」
主要是对汤底内容的生成、评分标准、以及结束标准的设定,确保游戏过程是完整流畅的。增强游戏规则的约束性,确保限定提问次数用完后,用户若不给出答案,则会被判定游戏失败。
(coze 截图)
(智谱清言 截图)
三、「示例」
主要目的是规范输出的游戏介绍部分,让其能更贴合自己的设想,让用户明白游戏规则。
(游戏过程中-对话截图)
四、评判标准
在调试过程中,在生成内容及对话过程流畅的基础上,重点关注了是否能做到以下几点:
- 开局清楚的介绍游戏规则
- 生成的汤面和汤底内容是否符合逻辑,且汤面是否能与汤底内容对应上
- 是否做到了“提示剩余回答次数”、“最后一次提问提醒还原真相”、“超过限定提问次数继续提问则告知游戏失败”等要求
- 游戏过程中可的变通性:可以满足更换题目、更改提问次数、提前放弃游戏等要求
- 能做到不同难度汤底设定不同的回答次数
目前存在的不足之处:
- 智谱清言中,玩的次数多了会出现重复的或相似的汤底。
- 虽然coze生成的汤底难度会大于智谱清言,会更“烧脑”,但coze对中文内容的生成会出现逻辑性不强,或前后语句矛盾的现象
本文由 @Abby💫 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
汤底,汤面,一开始是不是可以在游戏介绍里说明一下? 对于不知道这个名词的人初次体验游戏可能会有疑问。
感谢建议!已优化~
哦,对。还有一开始让用户选择难度等级。
玩了一下。有几个感受和建议。给我的题目是一个男的死于家中,留了个纸条那道题目(可能是AI生成的吧,但是评论区没法发图片,也不能太多字数)。
1、游戏规则没有讲清楚,至少我是不理解的。我为什么一定要提问,才能进入游戏?这个猜测及推理死因路径的场景,是否可以直接回答,进入游戏?
2、在用户只提问了1个问题,或者2个问题(少量的问题)就答对后,就给予一定的反馈,比如“你好棒!你真厉害!”这样的。用户就会被你的夸赞而开心,继续玩下去。
3、在我答对了(与汤底无限接近,甚至比汤底还要完善时)。系统直接给我反馈9分。不告知我满分多少分。这里好的做法是:告知我得分,满分多少,以及失分原因。
4、奥,一开始进入游戏。游戏的玩法介绍里,有一句语句不通顺的地方:“记住,你只能问能回答“是”、“否”、“无关”的问题。”(这是游戏设计者给大模型写的prompt吧?大模型怎么吐出来给用户了?)
5、游戏没有进入前,一直是大模型的通识能力在回答用户问题,个人觉得智谱的chatglm对中文的理解很牛了。回答不会很生硬,而且能准确get到我的问题。
//汤底:“这个男子在长期严重的抑郁症影响下,决定以自杀结束自己的痛苦。他在自杀前做好了充分的准备,确保不被人打扰。他选择用头部撞击坚硬的柜子来结束自己的生命。”
//我问了2问题后给出的答案:“这个男子,在生前患有严重的抑郁症,且抑郁了很长一段时间,他每天活的都很痛苦,失去了相信别人的能力,所以这一天,他决定以自杀的方式来了结自己的生命,结束自己的痛苦,并在自杀前做好充足的不被他人所打扰的准备(正如他纸条上写的那样:他们是不可信的,我必须自己来)。他选择自己用头部来撞击坚硬的柜子方式进行自杀。
以上,就是我对于他自杀原因以及自杀路径的猜测”
1.在选择完汤底之后,得到题目之后,提问(就是对汤面进行推理,然后给出自己的回答)就是已经在游戏中了。(不知道我有没有回答你的问题)
2.因为这个游戏中“主持人”的人设一般只是“机械”的回答是与否,就是没有增加情感反馈,后续会考虑是否增加
3.游戏规则中是有提到满分为10分的,测试时其实是有告知失分原因的,我可以在prompt中特殊强调下这点
4.这个可能是个意外?我后续玩的时候没出现这个问题,有空可以再体验玩一下~
5的问题是不超出评论字数被吞了?
玩了一下。有几个感受和建议。给我的题目是一个男的死于家中,留了个纸条那道题目(可能是AI生成的吧,但是评论区没法发图片,也不能太多字数)。
1、游戏规则没有讲清楚,至少我是不理解的。我为什么一定要提问,才能进入游戏?这个猜测及推理死因路径的场景,是否可以直接回答,进入游戏?
2、在用户只提问了1个问题,或者2个问题(少量的问题)后,就给予一定的反馈,比如“你好棒!你真厉害!”这样的。用户就会被你的夸赞而开心,继续玩下去。
3、在我答对了(与汤底无限接近,甚至比汤底还要完善时)。系统直接给我反馈9分。不告知我满分多少分。这里好的做法是:告知我得分,满分多少,以及失分原因。
4、奥,一开始进入游戏。游戏的玩法介绍里,有一句语句不通顺的地方:“记住,你只能问能回答“是”、“否”、“无关”的问题。”(这是游戏设计者给大模型写的prompt吧?大模型怎么吐出来给用户了?)
5、游戏没有进入前,一直是大模型的通识能力在回答用户问题,个人觉得智谱的chatglm对中文的理解很牛了。回答不会很生硬,而且能准确get到我的问题。
//汤底:“这个男子在长期严重的抑郁症影响下,决定以自杀结束自己的痛苦。他在自杀前做好了充分的准备,确保不被人打扰。他选择用头部撞击坚硬的柜子来结束自己的生命。”
//我问了2问题后给出的答案:“这个男子,在生前患有严重的抑郁症,且抑郁了很长一段时间,他每天活的都很痛苦,失去了相信别人的能力,所以这一天,他决定以自杀的方式来了结自己的生命,结束自己的痛苦,并在自杀前做好充足的不被他人所打扰的准备(正如他纸条上写的那样:他们是不可信的,我必须自己来)。他选择自己用头部来撞击坚硬的柜子方式进行自杀。
以上,就是我对于他自杀原因以及自杀路径的猜测”
体验链接如下:
· 智谱清言 :https://chatglm.cn/main/gdetail/65dede57bd0ecdb989d48294
· coze :https://www.coze.com/store/bot/7343203696614080530?bid=MDQEEPee5u8s4RXeOxvk7uRPOOMEHvmY9NwtDHV-qvx-hz2HCTPrNiffScrp3vQahZyZ-QQA&share=1&from=others
Cool