什么是大模型幻觉？应该如何解决？ | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

什么是大模型幻觉？应该如何解决？

贝琳_belin

2024-06-27

0 评论 4182 浏览 7 收藏

6 分钟

自从大模型发布后，幻觉问题就一直如影随形没能得到妥善的解决。这篇文章，作者就分析了大模型幻觉的原因和解决方法，供大家参考。

一、什么是大模型幻觉？

语言模型的幻觉（Hallucination）指的是模型生成了不符合事实或毫无根据的信息。这种现象在自然语言处理（NLP）任务中尤其常见，如机器翻译、文本生成和问答系统。

比如：用户问模型：“秦始皇为什么喜欢用苹果手机，为什么不喜欢用安卓手机呢？”

在还没有训练的很完善的大模型就可能会出现一本正经的回答关于秦始皇喜欢用什么手机的问题，也就是我们常说的“一本正经的胡说八道”。这就是大模型产生的幻觉。

那么大模型的幻觉是怎么来的？我们应该如何解决呢？

二、大模型幻觉是怎么来的

大模型的幻觉主要来自三个方面：

1）训练数据的局限性

当我们深入研究大模型的训练流程时，我们会发现，数据是最关键的。在预训练阶段，我们无法控制数据的来源，因为网上充满了随机网页内容，很多内容可能并不准确，我们无法完全清洗这些数据，只能尽量让语言更加通顺。

而在sft阶段时，当训练数据中可能包含错误信息或诱导信息时，这些信息在模型生成时可能被误用。另外一个，从数据覆盖范围来说，训练数据可能不完全覆盖所有的事实或领域，导致模型在生成特定信息时缺乏足够的背景知识。

2）大模型对自己高估

这主要是因为模型在预测 next token 的概率时，本质上是在处理数据分布的问题，对于非常大的 LLMs 来说，正确答案和错误答案的分布熵可能是相似的，LLM 在生成错误答案时和生成正确答案时同样自信。

另外，模型具有短期记忆，在模型在生成长文本时，可能无法完全记住并正确应用之前提到的所有信息，导致信息不一致或错误。有时，模型也可能会被上下文误导，生成与上下文相关但不真实的信息。

3）模型架构和训练方法

大语言模型的训练的最初期的目的是生成流畅和连贯的文本，而不是确保事实的准确性。所以模型可能就会生成符合语言习惯但不符合实际情况的内容。同理，尽管大语言模型可以处理大量数据，这也使它们并不具备真正的常识推理能力，不能像人类一样进行逻辑验证。就需要大量的标注人员去训练他们使他们能够准确的进行推理和保证事实的准确性。

三、大模型幻觉如何解决

大模型自生产出来之后，幻觉就是一直出现的问题。大模型的幻觉，极大的影响了用户对于大模型以及大模型产品的信任程度，能否成功解决幻觉问题以及能够在多大程度上缓解这个问题，都与大模型实际应用的深度和广度紧密相关。

在sft阶段，解决大模型幻觉的方式就是：

第一，增加样本数据和多样性，让更多样的样本可以为模型提供更全面、更准确的背景知识，使其在生成回答时能够参考更广泛的信息源，从而减少生成幻觉的概率。

第二，提高泛化能力，多样性的样本可以帮助模型学习不同的语境和表达方式，增强其在不同场景下的泛化能力，减少因特定样本偏差导致的错误。

第三，减少偏见，多样的样本有助于减少模型的偏见，确保其在面对各种问题时能够做出更公平和准确的回答。

当然大模型的幻觉的解决并不是一蹴而就的事情，他需要我们长期的优化和训练。但要完全解决这一问题，还需要多方面的改进和努力。

本文由 @贝琳_belin 原创发布于人人都是产品经理。未经作者许可，禁止转载

题图来自Unsplash，基于CC0协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

贝琳_belin

分享各种AI知识和干货，公众号：贝琳belin

13篇作品 69994总阅读量

AI 2.0时代，内容型产品的增长之道

10-304132 浏览

AI 2.0时代，内容型产品的增长之道

如何让可用性测试像剧本杀一样容易

03-152816 浏览

如何让可用性测试像剧本杀一样容易

Saas产品价值体系–产品价值设计的原则与方法

08-151140 浏览

Saas产品价值体系–产品价值设计的原则与方法

10天速产一部，国产霸道总裁短剧披上“狼人”外衣，令海外观众“上头”

12-272666 浏览

10天速产一部，国产霸道总裁短剧披上“狼人”外衣，令海外观众“上头”

在抖音卖车，在快手卖房

02-063061 浏览

在抖音卖车，在快手卖房

评论

目前还没评论，等你发挥！