想要减轻大模型的幻觉?来试试传统开发与大模型技术结合的新模式

1 评论 451 浏览 1 收藏 7 分钟

AI幻觉一直是各个AI开发者头疼的问题之一,而且我们也无法保证AI的回答完美无缺。本文将带你深入探讨大模型技术与传统软件开发之间的根本区别,并提出如何将两者的优势结合起来,以实现更高效、更准确的开发模式。

你是否曾经希望大模型技术能给出100%正确的结果,却屡屡失望?

你是否曾经一度怀疑自己不会用还是太高看大模型了,导致你的判断失误?

我想说,一切指望着大模型输出100%正确的这个出发点就有问题,核心就是搞错了传统开发和大模型开发的差异和逻辑思路。

那,如何既能使用大模型优秀的推理能力也能同时保证100%正确呢?

我们将深度探讨这些问题,揭示大模型与传统开发思路的矛盾,并提出新的解决方案。

01 传统开发与大模型开发的根本区别

在探讨为什么大模型技术无法实现100%准确的结果之前,我们需要先理解传统开发思路与大模型技术之间的根本区别。

传统开发的特点:强逻辑与稳定性

传统的软件开发方法通常基于明确的逻辑判断和规则。这些规则由开发者定义,代码的执行是确定性的:只要输入相同,输出结果就会完全一致。

这种方法的优点在于其结果的可预测性和稳定性。例如,金融软件中的交易系统、银行系统的账务处理等,都需要精确无误的结果,因此传统开发方式的逻辑性和一致性非常重要。

大模型开发的特点:模型训练和推理的不确定性

与传统开发不同,大模型开发(如大型语言模型和深度学习模型)依赖于海量的数据和复杂的算法进行推理。

这些模型的训练过程涉及从大量数据中学习模式和关系,而不是明确的规则。因此,大模型的输出具有一定的随机性和不确定性。

例如,生成式AI在创作文本时,虽然可以生成高质量的内容,但由于其基于概率的推理,输出结果可能会有所不同,即使输入条件相同。这种不确定性使得大模型的结果难以保证100%的准确性。

02 新型开发模式:传统开发与大模型开发的结合

讨论结合的模式,先科普一下当前的软件是如何完成开发的,当前软件用户看到的和用到的是用户界面,这个主要由前端完成;而一些基于用户的操作而引发的一些处理逻辑,大部分是由后端完成。

核心思路:前端用大模型+传统开发,处理自然语言和简单逻辑;后端用传统开发,处理数据计算和复杂逻辑。

前端如何结合?

在用户与系统的交互前端,大模型技术可以用于处理复杂的自然语言查询和生成智能回复。

大模型能够理解用户的问题,并基于其训练数据生成自然流畅的回答。

例如,在政务服务的智能客服系统中,用户可能会问:“如何申请居住证?”大模型可以解析用户的查询,理解其意图,并生成详细的回答,包括所需的申请材料、步骤和注意事项。

案例分享:政务智能客服

1. 大模型处理用户提问和回复

在用户发起问题时(例如:“如何办理护照?”),智能客服系统的前端利用大模型技术进行自然语言理解。大模型能够分析用户的意图,提取关键字,并生成详细的回答。

这些回答包括办理护照所需的材料、申请流程、收费标准等信息。如果用户有更多问题,大模型还可以根据上下文继续进行交互。

2. 后端传统开发确保数据一致性

后端主要负责存储用户的查询记录、处理申请数据和管理事务流程。传统开发方法用于实现这些功能,包括数据存储、事务管理、规则引擎等。

例如,后台系统会根据用户的查询记录更新相关的服务状态,管理申请的审批流程,并确保数据的一致性和准确性。传统系统的稳定性在这里至关重要,因为它确保了业务逻辑的准确执行。

最后的话

如果你自认为真的懂大模型技术,请早点放弃100%正确的幻想,有两种解决思路:

第一种:接受90%多的正确率(在某些场合人还不到80%),这种就很适合直接用大模型技术处理。

第二种:采用新型开发思路,各取所长。将复杂逻辑交给传统开发,将自然语言处理和理解交给大模型。

希望带给你一些启发,加油。

作者:柳星聊产品,公众号:柳星聊产品

本文由 @柳星聊产品 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 欢迎留下各位的启发~

    来自北京 回复