全球专利数据怎么玩才有趣?之 共现图谱(二)
本文介绍了从全球专利数据中构建共现图谱并对网络中心度进行测算方法,为产业研究提供了一种新的视角和工具,帮助用户更有效地识别和分析技术领域的顶尖资源。
一、说职场故事
招才引智、科研合作、科技攻关都有以下需求:
- 找到某个技术领域的顶尖人才团队
- 找到某个技术领域的顶尖科研机构/企业
如何通过大数据挖掘的方式帮客户实现这些需求呢?以下我们从全球专利视角给出对应答案。
二、共现图谱构建、中心度的测算
接下来我们主要讲解如何从全球专利中找到顶尖团队、顶尖科研机构/企业,在进入这个主题之前我们需要学习下共现图谱知识。
从下图我们可以看出,同一篇专利可能存在多个申请人、发明设计人、IPC分类号。
如果有100条专利,我们就可以根据这3个字段构建共现关系。比如,以IPC为例,就可以构建IPC共现图谱:
在该图中,节点的大小表示相应分类号出现的频次,节点越大,说明100篇专利与该分类号相关的标准必要专利越多;节点之间的连线表示两个分类号同时出现在一个标准必要专利中,连线越粗,代表两个节点同时出现的次数越多,关系越密切。
社区发现是一种将网络分成若干个社区的方法,根据其网络中节点之间的联系和相似性将节点划分为不同的社区,处于同一社区的节点之间更加相似、联系更加紧密。
在社会网络分析方法中,常见的衡量节点重要性的指标有点度中心度、中介中心度、接近中心度和特征向量中心度,可以根据这些中心度计算综合中心度从而确定某个节点在整个网络的重要性,各个中心度的说明如下:
三、说应用场景
有了共现图的构建方法及网络中心度的测算方法,在产业研究领域主要应用场景有:
- 找到某技术领域的顶尖人才团队
- 找到某技术领域的顶尖科研机构/企业
- 找到某技术领域的核心技术
应用场景一 :找到某个技术领域的顶尖人才团队
比如推荐人工智能领域5个顶尖人才团队
应用场景二:找到某个技术领域的顶尖顶尖科研机构/企业
比如推荐人工智能领域的顶尖的科研机构团队
方法同上,只不过这次换成“申请人”构建共现图谱,这里可以分为二类:一类为研究机构、一类为企业,流程如下:
应用场景三:找某个技术领域的核心技术
比如人工智能领域的核心技术有哪些
方法同上,这次根据专利所属“IPC分类号”构建共现图谱,流程如下:
需要特别指出的是,如果需要对核心IPC进一步凝练成技术短语的化,可以利用大模型语义理解和抽取能力做进一步工作。
四、写在后面的话
本文主要介绍了共现图谱的构建方法、网络中心度的测算方法,然后阐述了共现图谱可以在产业研究领域的应用场景。需要注意一下几点:
- 范围可以不限于全球专利:虽然讲述的是全球专利分析挖掘,但该分析研究方法可以拓展到“顶刊”“全球项目”数据的挖掘中。
- 在实际应用中可以保持灵活性:比如本文用的“综合中心度”代表节点的重要性,实际可以根据情况选取任意一个中心度作为重要性指标。
本文由 @王海涛 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!