聚类分析在用户分类中的应用 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

注册 | 登录

聚类分析在用户分类中的应用

2013-10-16

0 评论 18378 浏览 21 收藏

什么是聚类分析？
聚类分析属于探索性的数据分析方法。通常，我们利用聚类分析将看似无序的对象进行分组、归类，以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高，组间对象相似性较低。在用户研究中，很多问题可以借助聚类分析来解决，比如，网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中，用户分类是最常见的情况。
聚类分析的基本过程是怎样的？

选择聚类变量
聚类分析
找出各类用户的重要特征
聚类解释&命名

|| 选择聚类变量

在设计问卷的时候，我们会根据一定的假设，尽可能选取对产品使用行为有影响的变量，这些变量一般包含与产品密切相关的用户态度、观点、行为。但是，聚类分析过程对用于聚类的变量还有一定的要求：

这些变量在不同研究对象上的值具有明显差异；
这些变量之间不能存在高度相关。

因为，首先，用于聚类的变量数目不是越多越好，没有明显差异的变量对聚类没有起到实质意义，而且可能使结果产生偏差；其次，高度相关的变量相当于给这些变量进行了加权，等于放大了某方面因素对用户分类的作用。

识别合适的聚类变量的方法：

对变量做聚类分析，从聚得的各类中挑选出一个有代表性的变量；
做主成份分析或因子分析，产生新的变量作为聚类变量。

|| 聚类分析

相对于聚类前的准备工作，真正的执行过程显得异常简单。数据准备好后，丢到统计软件（通常是spss）里面跑一下，结果就出来了。

这里面遇到的一个问题是，把用户分成多少类合适？通常，可以结合几个标准综合判断：

看拐点（层次聚类会出来聚合系数图，如右图，一般选择拐点附近的几个类别）
凭经验或产品特性判断（不同产品的用户差异性也不同）
在逻辑上能够清楚地解释

|| 找出各类用户的重要特征

确定一种分类方案之后，接下来，我们需要返回观察各类别用户在各个变量上的表现。根据差异检验的结果，我们以颜色区分出不同类用户在这项指标上的水平高低。如下图，红色代表“远远高于平均水平”，黄色代表“平均水平”，蓝色代表“远远低于平均水平”。其他变量以此类推。最后，我们会发现不同类别用户有别于其他类别用户的重要特征。

|| 聚类解释&命名

在理解和解释用户分类时，最好可以结合更多的数据，例如，人口统计学数据、功能偏好数据等等(如下图）……最后，选取每一类别最明显的几个特征为其命名，就大功告成啦！

参考资料：

http://www.redshiftresearch.co.uk/ImageLibrary/Cluster%20Analysis.pdf

《社会统计分析方法——spss软件应用》

原文来自：网易UED

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

我不制造文章，我是互联网的搬运工

979篇作品 15643539总阅读量

中台产品经理02：产品经理如何用一套方法搞定复杂业务拆解？

04-138121 浏览

中台产品经理02：产品经理如何用一套方法搞定复杂业务拆解？

团买买会是美团优选的“解药”吗？

11-101328 浏览

团买买会是美团优选的“解药”吗？

陆冲之后，年轻人爱上了“躲猫猫”

11-101330 浏览

陆冲之后，年轻人爱上了“躲猫猫”

从0到1餐饮创业，才明白的30件事（1）

11-163037 浏览

从0到1餐饮创业，才明白的30件事（1）

快手会被微信视频号“边缘化”吗？

07-031795 浏览

快手会被微信视频号“边缘化”吗？

评论

目前还没评论，等你发挥！

18004人已学习15篇文章

用户激励体系的签到功能设计指南

签到功能是培养用户习惯的好办法。本专题的文章提供了签到功能的设计指南。

11821人已学习13篇文章

如何做好新用户激活？

激活是指用户通过完成关键行为，真正成为产品的用户，而提升新用户激活则是留存用户的第一步。本专题的文章分享了如何做好新用户激活。

65833人已学习3047篇文章

16408人已学习12篇文章

对账体系的设计思路

本专题的文章分享了对账体系的设计思路。

31859人已学习16篇文章

短视频产品该如何设计和运营？

短视频盛世之下，突围的机会在哪？

14256人已学习13篇文章

什么是数据仓库？如何搭建数据仓库？

数据仓库是所有产品的数据中心，公司体系下的所有产品产生的所有数据最终都流向数据仓库。本专题的文章分享了什么是数据仓库和如何搭建数据仓库。