全球专利数据怎么玩才有趣?之 聚类算法(三)
文章通过实际应用案例,展示了聚类算法在专利数据分析中的实用性,为技术研究方向的挖掘提供了一种有效的方法。
一、说职场故事
在产业研究中,有以下研究需求:
- 洞察行业龙头企业所聚焦的技术领域。
- 追踪某位专家的研究方向及其演变。
- 把握某一产业领域近年来的技术发展趋势
那今天讲解如何利用全球专利数据来实现这些研究目标,在此之前,让我们先了解聚类算法的相关知识。
二、聚类算法
聚类算法是一种无监督学习方法,旨在将数据集中的对象划分为若干个类别或簇,使得同一类别内的对象相似度较高,不同类别之间的相似度较低,简言之就是自动实现“物以类聚,人以群分”。
常见的聚类算法有K-means、层次聚类、DBSCAN、谱聚类、高斯混合模型、模糊C-means、K-medoids、Mean Shift、OPTICS、BIRCH等,不同的聚类算法各有优缺点,适用于不同类型的数据和不同的应用场景。选择合适的聚类算法通常取决于具体的需求、数据的特性和计算资源。不同的聚类算法介绍、优缺点可参考该份资料
https://blog.csdn.net/Java_college/article/details/136173448
三、说应用场景
聚类算法在全球专利数据挖掘中发挥着重要作用,可用在以下研究场景:
- 分析企业技术研究方向及趋势分析
- 分析某位专家研究方向及研究趋势
- 分析某个产业领域技术发展方向及趋势
1. 应用场景一:分析企业技术研究方向及趋势分析
以A企业为例,我们可以通过查询其专利数据集,利用模型或第三方接口提取技术关键词,再通过聚类算法整理出技术清单,这些清单将直观展示企业的主要研究方向。若要观察企业技术演变趋势,我们可以根据专利的“申请日期”将数据分为不同时间段,然后通过聚类算法分析,便可揭示企业在不同时期的技术发展轨迹。流程如下:
2. 应用场景二:分析某位专家主要研究方向及研究趋势
方法同上,其核心是获取专家的专利数据集。流程如下:
3. 应用场景三:分析某个产业领域技术发展方向及趋势
以人工智能领域为例,我们可以采用相同的方法,通过聚类算法分析近年来的技术方向,揭示该领域的技术发展趋势。流程如下:
四、写在后面的话
本章我们探讨了如何通过聚类算法从全球专利数据中挖掘技术研究方向,需要注意的是:
(1)聚类算法不仅适用于全球专利分析,同样可以扩展到顶级期刊和全球项目数据集的分析中。
(2)聚类算法常与大型模型结合使用,以更精准地提炼技术关键词。
本文由 @王海涛 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
文章中直观的图表和报告,可以帮助我们快速洞察行业趋势、技术热点以及竞争对手的动向。