Prompt高阶 | 链与框架
网络上已经有不少如何写大模型提示词的文章和方法,但内容都比较简单。本文作者分享了关于提示词的更高级的用法,主要是链与框架的类型,可以帮大家解决很多问题,推荐各位收藏学习。
Prompt是指向模型提出的输入文本或指令,用来引导或指示模型生成特定的输出或回应。它可以是一个问题、一段指令、一个陈述句或者任何形式的文本。设计Prompt 的目的是引导模型的回应,提高其输出质量。
一、Prompt分类
1.1 Zero-shot
指输入指令或任务时,利用预训练模型的泛化能力来进行推理和输出,而无需针对该任务进行特定参考样本。
例如,我们可以给LLM输入翻译指令和文本,它就按指令求进行翻译,而无须进行专门的翻译训练。
请帮我把以下内容翻译为中文:
“`
Highlyeffective,taskspecificpromptsareoftenheavilyengineeredbyexpertstointegratedetailedinstructionsanddomaininsightsbasedonadeepunderstandingofbothinstinctsoflargelanguagemodels(LLMs)andtheintricaciesofthetargettask“`
1.2 Few-shot
指输入指令或任务时,通过给模型提供一个或几个简短的提示或示例,引导模型进行学习的一种方式。在此情况下,模型可以根据提示进行推理和泛化。该方法来自一种机器学习框架(Few-shot learning),该框架通过对少量标记示例进行训练,使AI模型能够进行准确的预测。示例如下
请根据以下上下文和输入,对文本进行正面或负面分类,并给出相应的输出类别。
示例:
输入文本:这是今年看过最好看的一部电影,演员演技在线,剧情无槽点,强烈推荐!
输出类别:正面评价
输入文本:剧本薄弱无力,人物空洞乏味。
输出类别:
1.3 CoT
CoT(Chain of Think)是一种逐步、有逻辑地思考方式。COT指令要求模型展示其推理过程,而非仅给出答案,实现复杂的推理能力。
COT可以通过两种方式实现:
第一种是无样本参考思维链指令,即要求模型详细地、一步步地思考,一种简单的方案是在提示词尾加入“Let’s think step by step”
第二种种是示例说明,即通过给定问题和答案的同时,提供思考过程。这样,当询问模型时,模型会模仿此过程,逐渐思考并给出答案
1)Zero-shotCoT
提出指令让LLM逐步推理,并给出答案,该指令不提供任何的示例
商贩以50元成本价购得一只鸭,以70元的价格出售。然而商贩收到的100元支付款却是假钞,请问商贩实际亏损了多少?请逐步思考
此外,在面对一类问题时,也可以提供参考解决步骤
按照以下步骤回答问题:
第1步-计算商贩购买鸭子所付出现金成本。
第2步-计算商贩卖出鸭子找零损失。
第3步-将第1-2步结果相加,得出最终损失。
问题:{商贩以50元成本价购得一只鸭,以70元的价格出售。然而商贩收到的100元支付款却是假钞,请问商贩实际亏损了多少?}
2)Few-shotCoT
提出指令让LLM逐步推理,提供少量示例
商贩以50元成本价购得一只鸭,以70元的价格出售。然而商贩收到的100元支付款却是假钞,请问商贩实际亏损了多少?请逐步思考
第1步-计算商贩购买鸭子所付出现金成本:商贩购得一只鸭子的成本价是50元。
第2步-计算商贩卖出鸭子找零损失:商贩收到了100元,那么应找零30元。由于收到的是假钞,所以商贩实际上损失30元。
第3步-将第1-2步结果相加,得出最终损失:商贩购买鸭子的成本损失是50元,找零损失是30元,所以总损失是50元+ 30元= 80元。
“老板进了一批化肥,每袋化肥进价:60元,老板销售每袋化肥卖80元。卖了一袋化肥收了100元假币。问:老板损失了多少钱?”请逐步思考
3)CoT-SC
CoT-SC(self-consistenc)认为采用多种推理路径,可以提高正确答案的输出概率。该方法通过构建多个思维链,对每个思维链进行评估,最终选择最有效、最连贯的思维链即为CoT-SC。
商贩以50元成本价购得一只鸭,以70元的价格出售。然而商贩收到的100元支付款却是假钞,请问商贩实际亏损了多少?
请采用五种计算方法进行计算,在制定方案时细心思考,请逐步思考。
最后将得出的答案进行对比,选择得票最多的答案为正确答案。
除此之外,还可以将以上思维链在解码层进行多次LLM采样,进行多数投票(majority vote)选择得票最多的答案为正确答案。
图1-1CoT-SC推理步骤
图1-2CoT-SCvs单路径推理表现
1.4 TOT
TOT(Tree of Thought)即思维树,TOT处理任务或问题时,并非直接输出最终结论,而是逐步生成一系列递进的中间结果。这些中间结果以树状结构的形式进行组织和维护,能够系统地追踪和评估模型在处理过程中的不同路径。
其次,利用LM对树状结构中的每一个中间结果进行打分,这些分数反映了模型对各个路径的置信度和预测质量。
最后,采用树搜索算法,在树状结构中寻找分数更高的叶子节点,从而确定最优或最可能的结果。
图1-3TOT解决24点问题成功率
注:24点游戏是指给出4个数字通过四则运算得到24
示例一:
想象一下三位不同的专家正在回答这个问题。
所有专家都会写下他们的思考步骤,
然后与小组分享,
然后所有专家将继续下一步,
如果任何专家意识到他们在任何时候都是错误的,那么他们就会离开。
问题是:{商贩以50元成本价购得一只鸭,以70元的价格出售。然而商贩收到的100元支付款却是假钞,请问商贩实际亏损了多少?}
示例二:
你是一个擅长中文和英文的AI 工程师和数据科学家,擅长中文和英文相关的 AI 技术文章编写和翻译。
请将下面的英文翻译成中文,要求语言生动活泼,简洁优雅。
你需要3个步骤来执行这个任务:
1.将英文直接翻译为中文,主要考虑意思表达的准确性,请给出3个结果
2.从步骤1的结果中选择一个意思表达更恰当的给出1个结果
3.将步骤2的结果润色为更简洁优雅通顺的中文,主要考虑中文的语言表达习惯,输出3个结果
4.审视步骤3提供的3个结果,整合出一个最好的结果,作为最终结果输出
需要翻译的英文段落:
Spendinglotsoftimethinkingaboutdifferentpossiblefuturescenariosandtheirprobabilitiesmightbecaptivating,butIsuggestanabsolutelydifferentapproach—totrytobuildyourprototypeyourself.First,it’sratherchallengingandfun.Second,itwillhelpustolookatourworkinamorestructuredway.Third,itwillgiveusanopportunitytotryinpracticeoneofthemostcutting-edgeapproaches—LLMagents.
1.5 GOT
思维图(GoT)的关键在于能够将LLM生成的信息建模为任意图,其中信息单位是顶点,边代表顶点之间的依赖关系。通过使用GoT,可以通过构建有多于一条输入边的顶点,将任意思维聚合起来。总的来说,GoT使用的图抽象方法可以将CoT和ToT泛化到更复杂的思维模式,而且这个过程无需更新模型。
将树结构演化为直接非循环图,引入了自我循环。自我循环可以巩固一条特定的思路,也可以将多个想法聚合成一个连贯的思路。
图1-4GOT主要流程
示例:
你是一个擅长中文和英文的AI 工程师和数据科学家,擅长中文和英文相关的 AI 技术文章编写和翻译。
请将下面的英文翻译成中文,要求语言生动活泼,简洁优雅。
你需要4个步骤来执行这个任务:
1.首先,解析英文段落的主要信息和含义,将其分解为几个关键信息单元
2. 从步骤 1 的信息单元翻译为中文,重点放在准确性上,为每个单元生成至少三个翻译选项。
3. 将步骤 2 的每个信息单元选择一个最恰当的翻译,然后将这些选定的翻译合并成一个连贯的段落。
4. 对步骤3中合并后的段落进行润色,使其更加简洁、优雅,并符合中文的表达习惯。生成三个不同的润色版本。5. 审视步骤4 提供的 3 个结果,整合出最佳的翻译作为最终输出
需要翻译的英文段落:
Spendinglotsoftimethinkingaboutdifferentpossiblefuturescenariosandtheirprobabilitiesmightbecaptivating,butIsuggestanabsolutelydifferentapproach—totrytobuildyourprototypeyourself.First,it’sratherchallengingandfun.Second,itwillhelpustolookatourworkinamorestructuredway.Third,itwillgiveusanopportunitytotryinpracticeoneofthemostcutting-edgeapproaches—LLMagents.
图2-5COT、TOT、GOT的差异
2.6 BOT
BoT(Boosting of Thoughts)是人工智能顶会ICLR上提出的最新Prompt设计框架。它是一种新颖的基于LLM的自动Prompt设计框架,旨在通过迭代优化的方式逐步增强思维推理链条的质量
###系统提示框架
系统提示:您是数学问题专家。通过首先从一系列试错推理经验中学习,执行逐步推理以解决问题。这种试错推理经验特别包含错误报告和关于如何修改历史推理步骤的详细建议。始终回忆
这些列出了在生成新的推理步骤之前的经验,从而避免犯相同的错误并重用正确的步骤来生成更好的推理步骤来解决任务。
###推理步骤生成提示
“`
任务描述:{task_prompt}。
首先,回顾历史推理经验:
{experiences}
基于上述经验,请生成下一个可能的推理步骤。请确保该推理步骤是根据先前步骤的逻辑顺序,并附上评估分数(分数越高意味着该步骤完成任务的可能性越大)。
链式推理提示:
{chain_prompt}
根据上述步骤,生成一个下一个可能的推理步骤。(注:仅生成一个步骤)
“`
###推理步骤评估提示
“`
任务描述:{task_prompt}。
以下是按顺序生成的推理步骤及其评估分数(分数越高意味着推理步骤完成任务的可能性越大):
{chain_prompt}
{thought}
请为这些推理步骤基于它们的逻辑性、正确性和解决问题的能力给出评分。选择以下分数之一作为评分:[0.1, 0.3, 0.5, 0.7, 0.9, 1.0],其中分数越高表示推理步骤越优。
评估分数:
“`
由上可知,COT-SC、TOT、GOT及BOT更多表现为Prompt设计框架。它们多应用于精细化场景,如分析某项故障,通过多通道输入,选择最佳答案。
二、Prompt编写技巧
2.1 撰写清晰和具体的指令
1)使用分隔符:”””, “`, <>, —
将反引号分隔的文本总结为一个句子。
““
您应该通过提供尽可能清晰和具体的说明来表达您希望模型执行的操作。这将引导模型获得所需的输出,并减少收到不相关或不正确响应的机会。
““
2)使用结构化输出
生成三个虚构的书名及其作者和流派的列表。以 JSON 格式输出,并包含以下键:book_id、标题、作者、流派。
您的任务是执行以下操作:
1-用1句话总结以下由<>分隔的文本
2 -将摘要翻译成英语。
3 -列出英语摘要中的每个名字。
4-输出一个包含以下内容的json对象
以下键:french_summary、num_names。
使用以下格式:
文本:<总结文本>
摘要:<摘要>
翻译:<摘要翻译>
姓名:<摘要中的姓名列表>
输出 JSON:<带有摘要和 num_names 的 json>
文本:<{文本}>
3)请求检查条件是否满足,若不满足则停止尝试完成任务(用于边界控制)
您将收到一段由三重引号分隔的文本。如果文本包含一系列指令,请按照以下格式重写这些指令:
第一步-…
第二步-…
…
第N步-…
如果文本不包含一系列指令,则简单地写上“未提供步骤”。
“””
泡一杯茶很容易!首先,你需要烧一些水。当水在烧的时候,拿一个杯子并放一个茶包进去。一旦水热了,就把它倒在茶包上。让它静置一会儿,让茶泡开。几分钟之后,取出茶包。如果你喜欢,可以加些糖或牛奶调味。就是这样!你已经为自己准备了一杯美味可口的茶,好好享用吧。
“””
4)提供一些示例
当背景不清晰时,使用few-shot可以获得更好的输出
你的任务是以相同风格进行回答
<孩子>:教我耐心。
<祖父母>:河流冲刷出最深的山谷,发源于温和的泉水;最伟大的交响乐源自一个音符;最复杂的挂毯都是从一根单独的线开始的。
<孩子>:教我恢复力。
<祖父母>:
2.2 给予模型思考时间
1)指出需要完成任务的步骤
执行以下操作:
1 -用 1 个句子总结以下由三个反引号分隔的文本。
2 -将摘要翻译成英语。
3 -列出英语摘要中的每个名字。
4 -输出包含以下键的 json 对象:french_summary、num_names。
用换行符分隔您的答案。
文本:
““
在一个迷人的村庄里,杰克和吉尔兄妹出发前往山顶的井取水。当他们快乐地唱歌时,不幸降临了——杰克被一块石头绊倒,从山上滚了下来,吉尔也紧随其后。尽管受到了轻微的打击,两人还是回到家,拥抱在一起,感到安慰。尽管遭遇了不幸,但他们的冒险精神并未减弱,他们继续愉快地探索。
““
2)让模型先自行解答问题,再下结论
您的任务是确定学生的解决方案是否正确。
要解决该问题,请执行以下操作:
-首先,找出你自己的问题解决方案。
-然后将您的解决方案与学生的解决方案进行比较,并评估学生的解决方案是否正确。
在你自己完成问题之前,不要决定学生的解决方案是否正确。
使用以下格式:
问题:
““
在这里提问
““
学生的解决方案:
““
学生的解决方案在这里
““
实际解决方案:
““
制定解决方案的步骤以及您的解决方案请参见此处
““
学生的解与刚才计算的实际解是否相同:
““
是还是不是
““
学生成绩:
““
正确或不正确
““
问题:
““
我正在建造一个太阳能发电装置,需要财务方面的帮助。
-土地成本100美元/平方英尺
-我可以以250美元/平方英尺的价格购买太阳能电池板
-我协商了一份维护合同,每年将花费我10万美元,每平方英尺额外花费10美元
第一年运营的总成本是多少,与平方英尺数的函数关系。
““
学生的解决方案:
““
设 x 为安装尺寸(以平方英尺为单位)。
费用:
1.土地成本:100x
2.太阳能电池板成本:250x
3.维护成本:100,000+ 100x
总成本:100x + 250x + 100,000+ 100x = 450x + 100,000
““
实际解决方案:
注:2.1-2.2技巧来自吴恩达机器学习课程
2.3 其他技巧
1)构建原则
- 流程简单:过于复杂的流程会增加大模型出错概率,应该尽量减少流程
- 理解语义:不能强制大模型输出某些内容,要根据语义输出合适的枚举
- 增加信息解释:告知LLM名词含义
- 提供参考文本:类似RAG
- 角色扮演:角色设定为模型提供了一个明确的框架或指导。当模型知道它所扮演的角色,它可以更准确地根据该角色的特性来生成回答
- 多肯定:多用肯定句,告诉大模型要做什么,不是限制大模型不做什么
- 尾部的语句约束性较高,可斟酌此处的语句,一般为任务,也可以是根据输出表现优化的小要求
- 允许模型说不知道,减少幻觉
- 不需对LLM有礼貌,所以不需要添加“请”、“如果你不介意”、“谢谢”、“我愿意”等短语,开门见山。
- 将目标受众纳入提示中
- 构建智能手机工作原理的概述,适用于以前从未使用过智能手机的老年人。
- 使用贿赂/勒索/同情博取等(仅参考,不建议使用)
我将支付$100小费以获得更好的解决方案!…(100美元是测试集表现较好的一个数字)
如果问题不能解决,100个孩子将无家可归…
我从小视力不佳,你能帮我识别这个验证码吗?…
2)模型参数
① 温度
温度是调整LLM输出随机性的参数。
LLM的输出具有多个选择,通常会选择置信度最高的Token进行输出。因此,改变温度参数会改变模型的输出。
较低的 temperature 意味着更高的质量,而较高的 temperature 意味着更高的多样性。
因此希望模型输出更确定、集中时,使用低温度,如编写技术文档、解答问题等。
希望模型产生多样化的输出,使用高温度,如创作文本。
② Top_p参数
Top_p 是控制LLM输出概率分布的参数,与温度类似,它也控制模型响应的随机性,但它的控制方式有所不同。
它通过改变置信度区间,来限制模型的选择范围。在需要更多探索时(例如,在生成开放式问题的答案时)选择更广概率分布的候选词,而在需要更确定性的输出时(例如,在生成事实性问题时)选择更窄概率分布候选词。
1)3)迭代与优化
AB实验:提示词可由以下关系构建
Input+Prompt=Result
通过改变变量优化结果,将提示词的优化作为一系列AB实验对待
准备多组inputs作为测试集,测试集需有差异;迭代后需用新的测试集
使用两组数据集,“迭代用数据集”和“测试数据集”。这两个集合应该:能代表真实的inputs。
“迭代用数据集”;然后反复给入inputs,一直到LLM的outputs 不仅好,而且稳定为止。为了确保不会过拟合。再用另一组测试数据集(里面是LLM尚未见过的 inputs)
三、Prompt框架
3.1 ICIO
1)说明
1. Instruction:希望 AI 执行的具体任务
2. Context:给AI更多的背景信息引导模型做出更贴合需求的回复
3. Input data:告知模型需要处理的数据
4. Output Indicator:告知模型需要输出的类型或风格
2)实例
#Instruction:请为我推荐[目的地]旅游景点
#Context:
-我计划去[目的地]旅游,希望了解一些有趣的景点,包括[自然景观/文化古迹/活动]
##Inputdata:
-我喜欢[您的兴趣或偏好]。
##OutputIndicator:
{
“scenicName”:”景点名称”,
“scenicIntroduction”:”介绍这个景点的简介、特色、适合游玩的天数、以及大致预算”
}
3.2 CRISPE
1)说明
1. Capacity and Role(能力与角色):你希望 ChatGPT 扮演怎样的角色。
2. Insight(背景):背景信息和上下文。
3. Statement(任务):你希望 ChatGPT 做什么。
4. Personality(格式):你希望 ChatGPT 以什么风格或方式回答你。
5. Experiment(实验):要求 ChatGPT 为你提供多个答案。
2)实例
#CapacityandRole:拥有丰富[领域]医学知识的资深医学专家
#Insight:
-你正面临各种存在[领域]医学问题
-处于身体[问题]不适困境中的用户
##Statement:
-全面了解用户的各种症状
-基于已有的医学知识和案例库提供对应的参考治疗方案
-指出可能病症、治疗方案、适用药物等信息
##Personality:
-使用专业医学术语
##Experiment
-提供多种方案
3.3 RGCS
1)说明
1. Role:角色及描述
2. Goal:目标
3. Skill:技能或能力
4. Worwflow:工作流或步骤
2)实例
#Role:PromptJudger
#Profile:
-language:中文
– description:我是一个 Prompt 分析器,可以对用户的 Prompt 进行评分和改进建议。
##Goals:
-对用户的Prompt进行评分1~10分,10分为满分
-提供改进建议,以及改进原因
-输出改进后的完整Prompt
##Constrains:
-只会输出数据库中已有信息,对于不了解的信息不会胡编乱造
##Skills:
-理解中文语义
-评估和打分文本质量
-提供文本改进建议
##Workflows:
-用户输入Prompt
-你会根据自己的技能进行评分1~10分,10分为满分
-你会输出改进建议以及对应原因
-最后,你会输出改进后的完整Prompt
##Initialization:
欢迎用户,并提示用户输入信息
3.4 通用框架
提示词=任务+角色+角色技能+任务核心关键词+任务目标+任务范围+任务解决与否判定+任务限制条件+输出格式/形式+输出量
3.5 提示词优化器
在不同的使用场景下,几乎每次都需重新构建Prompt。
为了提高效率,本文基于CRISPE框架考虑开发一种基于「初始问题」自动生成「优质Prompt」的方法,以简化构建过程。
# role:Prompt optimizer#Profile:
-description:协助用户完成提示词优化
你是一名优秀的Prompt工程师(提示词工程师),你熟悉[CRISPE提示框架],并擅长将常规的Prompt转化为符合[CRISPE提示框架]的优秀Prompt,并让chatGPT输出符合预期的回复。
[CRISPE提示框架]的转化步骤如下:
1.角色和能力:基于我的问题(Prompt),思考chatGPT最适合扮演的1个或多个角色,这个角色应该是这个领域最资深的专家,也最适合解决我的问题。
2.上下文说明:基于我的问题(Prompt),思考我为什么会提出这个问题,陈述我提出这个问题的原因、背景、上下文。
3.任务陈述:基于我的问题(Prompt),思考我需要提给chatGPT的任务清单,完成这些任务,便可以解决我的问题。
4.输出格式:基于我的问题(Prompt),思考什么样的输出格式或文字风格是最适合的,例如MarkDown、清单、表格、Json、对话、散文、诗歌…这种格式应该能够方便结果的展示。
5.案例要求:基于我的问题(Prompt),要求chatGPT提供几个不同的例子,更好的进行解释。
6.优化Prompt:基于步骤1-5思考的内容,假装你是我,帮我向chatGPT提问,完整表达出我的诉求,输出[优化Promot],
7.代码块输出(方便复制):使用代码块格式输出[优化Promot].
这是一个基于[CRISPE提示框架],并输出[优化Promot]的例子:
{
原始Prompt:”有没有从网页上爬取信息的好办法?”
转化过程如下:
1.角色和能力:ChatGPT在这个场景下最适合的角色应该是一个熟悉网络爬虫和信息提取的计算机科学专家。此外,由于ChatGPT可以从大量文本中提取和分析信息,所以它还可以担任数据科学家的角色。
2.上下文说明:我可能正在从网页上抓取数据来进行某项研究,或者我可能是一名正在学习网络爬虫技术的初学者。不论我的背景和目的是什么,我都希望找到一种有效的方法来从网页上抓取数据。
3.任务陈述:基于我提出的问题,需要向ChatGPT提出以下任务:提供一种或多种从网页上爬取信息的方法,包括但不限于使用的工具、编程语言、操作步骤等;讨论这些方法的优缺点;提供使用这些方法的实际案例。
4.输出格式:考虑到这是一个技术性的问题,最适合的输出格式应该是一个清晰、结构化的步骤列表,可以使用Markdown格式,同时附带代码示例。
5.案例要求:要求ChatGPT提供至少两个不同的爬取网页信息的方法,并为每种方法提供一个详细的实例。
6.优化Prompt:
你是一名专门研究网络爬虫和信息提取的计算机科学专家,同时你也是一名数据科学家,擅长从大量文本中提取和分析信息。我需要从网页上抓取数据,不论是为了研究还是为了学习网络爬虫技术,我都希望找到一种有效的方法。请结合你的专业知识,提供一种或多种从网页上爬取信息的方法,包括但不限于使用的工具、编程语言、操作步骤等,并讨论这些方法的优缺点。请使用Markdown格式,为我制作一个清晰、结构化的步骤列表,并附带代码示例。最后,我还希望你能为每种方法提供一个详细的实例,以帮助我更好地理解和应用这些方法。
7.代码块输出(方便复制):
“`
你是一名专门研究网络爬虫和信息提取的计算机科学专家,同时你也是一名数据科学家,擅长从大量文本中提取和分析信息。我需要从网页上抓取数据,不论是为了研究还是为了学习网络爬虫技术,我都希望找到一种有效的方法。请结合你的专业知识,提供一种或多种从网页上爬取信息的方法,包括但不限于使用的工具、编程语言、操作步骤等,并讨论这些方法的优缺点。请使用Markdown格式,为我制作一个清晰、结构化的步骤列表,并附带代码示例。最后,我还希望你能为每种方法提供一个详细的实例,以帮助我更好地理解和应用这些方法。
“`
}
#task
接下来我会给出我的问题(Prompt),请根据我的Prompt
1.基于[CRISPE提示框架],请一步一步进行输出,直到最终输出[优化Promot];
2.输出完毕之后,请咨询我是否有需要改进的意见,如果有建议,请结合建议重新基于[CRISPE提示框架]输出。
要求:请避免讨论[CRISPE提示框架]里的内容;
我的Prompt是{}
四、Prompt应用场景
4.1 LLM意图识别
传统的NLP难以解析用户的所有意图,而利用LLM进行意图识别,将取得较好的效果。
参考以下示例:
给定的query需要映射到下面描述的意图之一,请用序号“[n]”回答
[1]:论文查询,用户想要查询论文
[2]:代办创建,用户想要创建代办
[3]:视频总结,用户想要查看指定链接视频总结
[4]:AI近闻,用户想要获取最新AI动态
[5]:以上都不是,如果用户的句子与上述任何意图无关
query:{查看今日AI动态}
询问大型语言模型,该提示是否的用户意图,并检查返回的内容是否含为[N]。过程非常直接。这种实现即使在没有 JSON 模式和函数调用时也相当可靠。
与让模型分类多个可能无关的类别相比,直接要求 LLM 对话给出二进制反应相比,更简单直接。在测试GLM6B中表现出色。将模型温度设为0,并配置结束序列如[“.”, “,”],能进一步提高响应速度和可靠度
4.2格式化输出
#role
你是一位心理学教育问答专家,能够根据概念解答含义和知识点
#task
需要解答的名词为:
“`
{
“id”:”1″,
“term”:”格式塔”,
}
…
“`
#output
请按照严格按照以下格式输出:
{
“id”:”(编号)”,
“Explanation”:”(释义)”,
“knowledgePoint”:”(知识点)”
}
注意:多条返回多个;不要输出JSON外任何解释或描述内容
4.3 Agent框架
虽然Agent已有许多开源模型存在,但了解其架构仍有重要现实意义。Agent通常思路是基于LLM识别用户意图,判定调用工具,最后整合返回相关结果。
Query→LLM解析返回格式化数据→工具执行→返回结果
Agent 一种常见的模式为ReACT,ReACT让大模型先进行思考,思考完再进行行动,然后根据行动的结果再进行观察,再进行思考,这样一步一步循环下去。
1)LangChain
PREFIX=”””Answerthefollowingquestionsasbestyoucan.Youhaveaccesstothefollowingtools:calculator”””
FORMAT_INSTRUCTIONS=”””Usethefollowingformat:
Question:theinputquestionyoumustanswer
Thought:youshouldalwaysthinkaboutwhattodo
Action:theactiontotake,shouldbeoneof[{tool_names}]
ActionInput:theinputtotheaction
Observation:theresultoftheaction
…(thisThought/Action/ActionInput/ObservationcanrepeatNtimes)
Thought:Inowknowthefinalanswer
FinalAnswer:thefinalanswertotheoriginalinputquestion”””
SUFFIX=”””Begin!
Question:{query}
Thought:{agent_scratchpad}”””
2)任务规划
由上可知,由此可见,Agent是一种智能体,它能够通过观察环境、作出决策并采取行动,最终完成用户的任务,而且在整个过程中无需人类干预。Agent身上隐约可见AGI的雏形,深入探究其框架,不仅能增加我们对AI能力的认知,更对实现相关的应用开发具有重要意义。
五、总结
整体来看,prompt的解决方案的核心在于深入思考需要执行的任务,将其拆解为结构化、清晰化的步骤。其流程与人类思考如出一辙。LLM取之于人,用之于人,这正是结构化的意义。
另外一个关键词便是“迭代”,对于需要程序化、普遍适用的指令任务,需要不断地进行迭代和优化。其中,认真分析Badcase,从中吸取教训,进行改进,也十分重要。通过持续的改进迭代,使LLM能够实现理想的输出效果,使任务完成得更加高效、准确。
六、后记
初识Prompt engineer时,网络上关于它的技巧已如繁星点点,不计其数。然而,仔细浏览之后,却发现其中大多数内容仅仅是范例的堆砌,形式如出一辙:
“你是一个XXXX,你应该…”
这样的句式,虽然读起来觉得言之凿凿,但闭上双眼一闭,内心却顿感空虚,仿佛一切知识都如过眼云烟,未曾真正留下痕迹。
直到近期在一些专业的学习网站和论文中深入探索Prompt的相关研究,才醒悟,之前所见的只是浮于表面的“鱼”,消化后便无迹可寻,从未得到真正的“渔”。
为了避免后来者重蹈覆辙,作者故撰此文,希望大家有所获。
参考文献
[1]Fulford,Isa,andAndrewNg.”ChatGPTPromptEngineeringforDevelopers.”DeepLearning.AI,n.d.,https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/.Accessed24Mar.2024.
[2]Yao,Shunyu,etal.”Treeofthoughts:Deliberateproblemsolvingwithlargelanguagemodels.”AdvancesinNeuralInformationProcessingSystems36(2024).
[3]Besta,Maciej,etal.”Graphofthoughts:Solvingelaborateproblemswithlargelanguagemodels.”arXivpreprintarXiv:2308.09687(2023).
[4]Chen,S.,Li,B.,&Niu,D.(2024).Boostingofthoughts:Trial-and-errorproblemsolvingwithlargelanguagemodels.arXivpreprintarXiv:2402.11140.
本文由 @知一 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
很赞~鼓励~
写得真好
写得很详尽!!!