ChatGPT的胜利，宣告知识图谱的消亡？ | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

注册 | 登录

ChatGPT的胜利，宣告知识图谱的消亡？

科技云报到

2023-05-24

2 评论 5724 浏览 9 收藏

知识图谱可以将不同领域、不同语言的知识整合起来，形成一个大规模的知识库，帮助人们更好地理解和使用知识。而ChatGPT不用借助知识图谱就可以很好地解决用户对话知识问答相关的任务，具有非常强大的理解能力、流畅的对话能力和上下文的刻画能力。未来，ChatGPT会取代知识图谱吗？

过去10年，知识图谱可谓是最接近“人工智能”的概念。业内普遍认为，知识图谱的概念最先是由谷歌于2012年正式提出，主要用来支撑下一代搜索和在线广告业务。

此后，这项技术迅速火爆，被国内外多家搜索引擎公司所采用，如：美国的微软必应，中国的百度、搜狗等，都在短短的一年内纷纷宣布了各自的“知识图谱”产品，足以看出这项革新对整个搜索引擎界的整体影响。

但这项技术的应用并不仅拘泥于搜索引擎领域范围。由于让人工智能具备了认知能力和逻辑能力，知识图谱进而实现了智能分析、智能搜索、人机交互、个性化推荐等场景应用，成为互联网知识驱动的智能应用的基础设施。

可以说知识图谱与大数据和深度学习一起，成为推动互联网和人工智能发展的核心驱动力之一。

然而，ChatGPT的横空出世让整个AI界都沸腾了。

ChatGPT带来的震撼在于，它不用借助知识图谱就可以很好地解决用户对话知识问答相关的任务，具有非常强大的理解能力、流畅的对话能力和上下文的刻画能力。

更重要的是，它将原来基于特定任务的模型变成了一个统一的、基于提示的、任务无关的模型，可以去尝试解决非常复杂或困难的、人类参与很多的任务。

这也让AI界认知产生了分化，有观点认为有了ChatGPT这种大语言模型后，知识图谱完全没有存在的意义，甚至有的公司已经彻底抛弃了知识图谱路线。

那么，在大模型时代，知识图谱真的要消亡了吗？

一、知识图谱VS大语言模型

在讨论这个问题之前，先来了解一下知识图谱和大语言模型的异同。

知识图谱从字面上看，可以拆分为知识+图谱，这样就可以理解：将需要的知识数据（结构化或非结构化数据）以图谱的形式进行展示，这种简单的过程也是知识图谱的构建过程。

知识图谱通常包含实体、关系和属性三个要素，例如人名、国家、语言等实体，以及人口、首都、官方语言等关系和属性。它可以根据图谱中定义的关系提供精确且逻辑一致的答案，因此对于信息检索、问答和结构化数据推理等任务特别有用。

大语言模型是基于深度学习和神经网络，像GPT-4这样的大语言模型是在大量文本数据上进行训练，以学习模式、上下文以及单词和短语之间的关系。

它们可以生成类似人类的文本、回答问题、提供建议以及执行其他自然语言任务，还可以很好地处理模棱两可和不完整的信息，并且处理广泛的主题。

不难发现，两者在知识的学习、分析、推理方面有着类似的功能，但却各有优劣势。

知识图谱通常需要手动或半自动构建，是一种非常耗时耗人力的工作，随着知识的不断扩展和变化，知识图谱也需要不断更新；

同时，它的作用仅限于图谱编码中的知识范围，这使得它在处理模棱两可或不完整的信息时准确率较低。

但它的优势在于准确的知识库，对于事实性的、专业性的知识有着非常高的准确度。

相反，专业知识在大模型训练语料里占比非常少，这也使得ChatGPT等语言大模型生成的内容的可靠性和真实性备受质疑。

它无法将真实与想象、真实与虚构分开，这种现象甚至促使创造了一个新术语：人工智能幻觉，维基百科将其定义为“人工智能的自信反应，其训练数据似乎没有合理性”。

同时，语言大模型需要大量的计算能力和资源来进行训练和微调，其花费的时间和成本也不容小觑。

目前，语言大模型只在通用领域给出了较为惊艳的表现，至于在知识图谱广泛应用的垂直领域，语言大模型暂时未显示出领先的一面。

二、知识图谱退场为时尚早

正因为语言大模型暂时还无法解决事实准确性、可信度、可追溯等问题，知识图谱的存在就非常有意义。

知识图谱或者类似的知识库、知识引擎，能够为大模型提供准确的知识，它可以被用来通知、聚焦、过滤和控制生成式人工智能，增强大模型响应的智能和可靠性，使其更适合关键任务。

当大模型真正落地到工业应用时，也需要有知识图谱对专业领域知识的支撑，至少短期来看是非常需要的。

因此，我们也可以说，知识图谱的构建原来有各种各样的构建方式，现在又多了一种构建方式——用大模型去辅助整个知识图谱构建，通过大量语料和大数据的学习，通过Prompt去进行知识的激发。

同时知识图谱反过来也能够去推动大模型Prompt工程里的相关工作，融入到大模型的训练中，使得生成更可控，更准确。同时，知识图谱也可以提供很多额外的语义信息，帮助大模型的知识推理做得更好。

所以从本质上看，大语言模型出现后，并不是将知识图谱消灭了，而是可以发挥知识图谱和大模型这两种技术的优势：在需要可控知识或可控逻辑的时候，知识图谱会发挥更大作用；在需要更自由的交互任务理解和生成时，大模型发挥更好的作用。

结合这两种方法的优势，可以产生更强大和有效的自然语言处理系统。

三、知识图谱与大语言模型的结合

那么，知识图谱如何与大语言模型相结合呢？

有意思的是，ChatGPT给出了将知识图谱集成到大语言模型中的几种方法：

1）使用知识图谱数据进行预训练

将知识图谱中的知识注入到大语言模型的预训练阶段，可以帮助大模型学习实体与其属性之间的关系。可以通过将知识图谱三元组（主语、谓语、宾语）转换为自然语言句子并将它们添加到训练语料库中来完成。

2）使用基于图的目标进行微调

在预训练之后，使用基于图的目标对特定任务的模型进行微调，可以帮助大模型学习使用图中编码的知识进行推理和推理。这可能涉及将自然语言查询转换为基于图形的查询，以及开发将基于图形的推理与基于文本的推理相结合的方法。

例如，可以对模型进行微调，以预测图形中缺失的实体或关系，这可以提高其对底层结构的理解。

3）改进实体链接和消除歧义

增强模型识别文本中的实体并将其链接到知识图谱中相应节点的能力。这可以通过在训练或微调期间结合高级实体链接和消除歧义技术来实现。

4）集成图嵌入

图嵌入是一种用于将图中的节点、边或整个子图转换为连续向量或低维表示的技术，机器学习算法可以更轻松地处理这些向量或低维表示。

图嵌入在知识工程的上下文中特别有用，因为它可以帮助将知识图谱中的结构化信息转换为可以更容易地与机器学习算法（尤其是神经网络）集成的格式。

使用图神经网络或其他图表示学习方法学习，并可用于丰富模型对实体及其关系的理解。

5）推理时查询知识图谱

当模型遇到需要精确、结构化知识的问题或任务时，可以查询知识图谱获取相关信息。这可以通过将自然语言查询转换为基于图形的查询（例如，使用SPARQL），然后使用检索到的信息来回答问题或执行任务来完成。

6）知识图谱引导生成

将大语言模型的生成能力与知识图谱中的结构化信息相结合，可以生成更准确、更相关的文本。例如，在生成实体的摘要或描述时，模型可以对知识图谱中的信息进行优先级排序，以确保事实的正确性。

7）混合模型

开发包含基于图和基于神经网络的组件的混合模型，可以利用这两种方法的优势。例如，图神经网络（GNN）可用于学习图结构数据的潜在表示，然后可以将其与大语言模型集成以执行自然语言处理任务。

8）鼓励可解释性和可解释性

开发允许大语言模型基于知识图谱为其推理和预测生成解释的方法。这可以帮助用户了解模型如何利用知识图谱中的结构化信息，并有助于调试和优化模型。

四、结语

技术的浪潮总是汹涌而至，在新的技术革新来临之际，我们更应该客观看待新旧技术的优劣，而不是冲动地去拥抱新技术，抛弃现有成熟技术。

对于知识图谱来说，大模型的出现并不是一个冲击，恰恰是给了知识图谱一个新的生长空间。当我们将大模型与自身优势的行业应用去深度结合，形成数据和算法的持续迭代，必将看到更好的结果持续涌现。

本文由@科技云报到原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自 Unsplash，基于 CC0 协议

该文观点仅代表作者本人，人人都是产品经理平台仅提供信息存储空间服务。提供信息存储空间服务。

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

科技云报到

专注于原创的企业级科技内容行家

37篇作品 80061总阅读量

出海人，2023怎么活？

01-102796 浏览

出海人，2023怎么活？

TEMU vs Shein，困在“低价制造”里的电商出海之战

05-096551 浏览

TEMU vs Shein，困在“低价制造”里的电商出海之战

达人营销，走向小V时代

12-193769 浏览

达人营销，走向小V时代

即时物流业务模式与计费详解

12-254841 浏览

即时物流业务模式与计费详解

交易和支付，有啥区别？

02-179008 浏览

交易和支付，有啥区别？

评论

产品蝶道

消亡啥啊，chatgpt训练优化的不需要用到知识图谱？

最近来自北京回复
1. 汪仔9650 回复产品蝶道
  
  这尼玛这个自媒体就离谱！拉黑他！
  
  最近来自上海回复

用户需求与商业目标的双赢战略

11-162707 浏览
工单系统——深度解析高效的功能架构（中）

04-1112273 浏览
私域案例 | 6200万+会员，线上销售增长63.95%，大参林是如何做好私域流量池运营的？

03-319132 浏览

18813人已学习15篇文章

评论区设计思路

评论区应该如何设计？本专题的文章提供了评论区设计思路。

14660人已学习13篇文章

如何搭建广告投放系统？

在产品的商业模式中，广告变现占据了很大的比重，那么广告功能就是产品里面非常重要的功能之一。本专题的文章分享了如何搭建广告投放系统。

12758人已学习12篇文章

产品立项指南

产品立项，对于产品来说是其生命周期中最基础的和最重要的阶段。产品立项都有哪些主要工作？本专题的文章分享了产品立项指南。

89762人已学习30篇文章

运营人如何提高自身竞争力？

想要脱围而出，你必须升级你的技能和思维。

34901人已学习22篇文章

产品动效设计全方位科普指南

从动效设计原则、动效工具、制作方法、标注技巧等全方位解读

15182人已学习12篇文章

如何做好服务设计？

服务设计在流程性和系统性的问题解决方面提供很好的思路和方法。本专题的文章分享了如何做好服务设计。