TOT（思维树）详解，探索如何让提示词“长脑子”

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

TOT（思维树）详解，探索如何让提示词“长脑子”

爱吃糖炒栗子

2024-12-04

0 评论 260 浏览 0 收藏

11 分钟

在探索人工智能的边界时，我们常思考如何让机器更接近人类的思维方式。思维树（Tree of Thoughts，ToT）便是这样一个创新的框架，它模拟了人类解决问题时的认知策略，让大型语言模型（LLM）能够以结构化的方式探索多种可能的解决方案。

思维树（Tree of Thoughts，ToT）是一个创新的框架，旨在增强大型语言模型（LLM）的推理能力。它模拟了人类解决问题的认知策略，使LLM能够以结构化的方式探索多种可能的解决方案，类似于树状分支路径。ToT框架通过将问题分解为一系列连贯的思维步骤，每个步骤都是一个语言序列，作为问题解决的中间步骤。　

ToT框架的作用主要体现在以下几个方面：　

提高解决问题的能力：ToT通过使LLM能够同时深入了解多个推理路径，显著提升其解决问题的能力。例如，在需要战略思维或规划的任务中，ToT表现出卓越的性能，成功率更高。

不确定性的处理：不确定思维树（TouT）是ToT的扩展，专门应对LLM决策过程中固有的不确定性。通过量化和管理这些不确定性，TouT可以获得更准确、更可靠的结果。

计算开销：ToT框架涉及复杂操作，如维护多条决策路径、回溯以及深入了解替代解决方案，这些过程计算密集，通常需要大量的处理能力和内存资源。

实施复杂性：构建思维树系统涉及整合各个组件，如提词器代理、检查器模块、内存模块和思维树控制器。每个组件都必须经过精细调整以协调工作，这可能是一个复杂且耗时的过程。

ToT框架已在多种应用中证明了其有效性，以下是一些典型的案例研究，其中ToT显著提升了解决问题的能力：　

数独解谜：ToT在数独解谜中的应用展示了其应对复杂逻辑挑战的能力。通过引导模型完成各种数字排列，并使其在遇到矛盾时回溯，简化了通往正确解决方案的路径。

24点游戏：在具有策略性的算术游戏24点中，ToT通过让模型深入了解多条计算路径，显著提高了成功率。

创意写作：ToT还应用于创意写作任务，可帮助LLM生成更连贯、更符合上下文的叙述。

5×5填字游戏：ToT的另一个显著应用是解决5×5迷你填字游戏。该框架使模型能够为每个纵横字谜线索考虑多个单词选项，不仅要评估它们的独立性，还要考虑其如何与已填入的单词进行交互。

如果你看过上一篇关于链式提示的文章（Prompt Chaining(链式提示）详解——面对疾风吧，复杂怪！）可能会有疑问，思维树和链式提示都是分解任务，然后分步解决，他们之间的区别是什么呢？　

诚然，思维树（Tree of Thoughts, ToT）和链式提示（Prompt Chaining）都是用于增强大型语言模型（LLM）解决问题能力的框架，但它们在方法和应用上存在显著差异。　

从优势上看：　

ToT的优势在于提高了解决问题的能力，尤其是在需要战略思维或规划的任务中。例如，在24点游戏中，ToT通过让模型深入了解多条计算路径，显著提高了成功率。此外，ToT还能够处理不确定性，通过量化和管理这些不确定性来获得更准确、更可靠的结果。

Prompt Chaining的优势在于它能够提高LLM应用的透明度，增加控制性和可靠性。例如，在撰写一篇论文时，可以通过一系列提示逐步引导模型完成引言、方法、结果和讨论等部分。

具体的区别可以用4点来概括：　

结构化程度：ToT采用树状结构，允许模型探索多个推理路径，而Prompt Chaining采用线性链式结构，每个提示基于前一个提示的输出。

解决问题的方法：ToT通过系统性探索和自我评估来解决问题，Prompt Chaining则通过逐步细化提示来引导模型。

应用范围：ToT更适合需要复杂规划或搜索的任务，Prompt Chaining则适用于需要清晰、合乎逻辑的思维顺序的任务。

计算开销：ToT由于其复杂的操作，如维护多条决策路径、回溯以及深入了解替代解决方案，通常需要更多的处理能力和内存资源。而Prompt Chaining则相对简单，易于实施。

为了更清晰地展示ToT和Prompt Chaining的区别，我举几个例子来感受一下二者的区别：

例子1：数学问题解决📌

ToT应用：　

问题：解决一个复杂的数学问题，如24点游戏。

步骤：

将问题分解为多个中间步骤，每个步骤生成一个中间方程。

使用BFS或DFS搜索算法探索所有可能的解决方案。

对每个步骤的候选项进行评估，选择最有前途的路径。

Prompt Chaining应用：　

问题：解决一个复杂的数学问题，如24点游戏。

步骤：

提供一个提示，要求模型识别问题类型和涉及的数字。

第二个提示要求模型提出可能的运算组合。

第三个提示要求模型计算并验证结果。

例子2：创意写作📌

ToT应用：　

问题：创作一个包含特定元素的短篇故事。

步骤：

构建思维树，每个节点代表故事的一个可能发展方向。

使用ToT框架生成和评估不同的情节发展。

选择最有吸引力的情节线进行深入开发。

Prompt Chaining应用：　

问题：创作一个包含特定元素的短篇故事。

步骤：

第一个提示要求模型生成故事的开头。

第二个提示基于开头生成中间情节。

第三个提示要求模型完成故事结尾。

例子3：旅行规划📌

ToT应用：　

问题：规划一次旅行，包括目的地选择、交通方式和住宿。

步骤：

将旅行规划分解为多个决策节点，如目的地、交通和住宿。

对每个决策节点生成多个选项，并评估每个选项的优劣。

选择最佳选项组合，形成完整的旅行计划。

Prompt Chaining应用：　

问题：规划一次旅行，包括目的地选择、交通方式和住宿。

步骤：

第一个提示要求模型提供目的地建议。

第二个提示基于选定的目的地提供交通方式。

第三个提示要求模型推荐住宿选项。

例子4：编程问题解决📌

ToT应用：　

问题：解决一个编程问题，如编写一个函数。

步骤：

将问题分解为多个逻辑步骤，每个步骤代表函数的一个部分。

生成每个步骤的代码，并评估其正确性。

组合各个步骤的代码，形成完整的函数。

Prompt Chaining应用：　

问题：解决一个编程问题，如编写一个函数。

步骤：

第一个提示要求模型理解问题并提出解决方案的概要。

第二个提示要求模型编写伪代码。

第三个提示要求模型将伪代码转换为实际的编程语言代码。

例子5：客户服务📌

ToT应用：　

问题：处理客户的复杂查询。

步骤：

将客户查询分解为多个子问题，每个子问题代表一个可能的解决方案路径。

生成每个子问题的解决方案，并评估其有效性。

选择最佳解决方案路径，形成完整的回答。

Prompt Chaining应用：　

问题：处理客户的复杂查询。

步骤：

第一个提示要求模型识别客户查询的关键点。

第二个提示要求模型提供相关信息或解决方案。

第三个提示要求模型根据客户的反馈进行调整。

通过这些例子，我们可以看到ToT和Prompt Chaining在解决问题时的不同方法。ToT通过树状结构和系统性探索提供了一种更全面和深入的解决方案，而Prompt Chaining则通过链式提示提供了一种更直接和逐步的方法。两者各有优势，适用于不同类型的问题和场景。希望你通过此篇文章，能够get思维树的核心理念，并应用到你的提示词工程中，毕竟，最好的学习永远都是实践~　

本文由人人都是产品经理作者【宋恒达】，微信公众号：【产品自由之路】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App