用数据分析细分用户:RFM分析

32 评论 218452 浏览 432 收藏 12 分钟

通过RFM方法,我们根据用户的属性数据分析,对用户进行了归类。在推送、转化等很多过程中,可以更加精准化,不至于出现用户反感的情景,更重要的是,对产品转化等商业价值也有很大的帮助。

应用背景:

在产品迭代过程中,通常需要根据用户的属性进行归类,也就是通过分析数据,对用户进行归类,以便于在推送及转化过程中获得更大的收益。

分析方法:

RFM分析(Recency,Frequency,Monetary)

分析工具:

SPSS(数据分析的重量级应用,与SAS二选一)

一.RFM基础知识

所谓探索性分析,主要是运用一些分析方法从大量的数据中发现未知且具有价值信息的过程。

常用的探索性分析方法包括:RFM分析、聚类分析、因子分析、对应分析等。

RFM的含义:

  • R(Recency):客户最近一次交易时间的间隔。R值越大,表示客户交易发生的日期越久,反之则表示客户交易发生的日期越近。
  • F(Frequency):客户在最近一段时间内交易的次数。F值越大,表示客户交易越频繁,反之则表示客户交易不够活跃。
  • M(Monetary):客户在最近一段时间内交易的金额。M值越大,表示客户价值越高,反之则表示客户价值越低。

RFM分析就是根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种方法。

  • RS:基于最近一次交易日期计算的得分,距离当前日期越近,得分越高。例如5分制。
  • FS:基于交易频率计算的得分,交易频率越高,得分越高。如5分制。
  • MS:基于交易金额计算的得分,交易金额越高,得分越高。如5分制。

RFM总分值:RFM=RS*100+FS*10+MS*1

RFM分析的主要作用:

  1. 识别优质客户。可以指定个性化的沟通和营销服务,为更多的营销决策提供有力支持。
  2. 能够衡量客户价值和客户利润创收能力。

RFM的假设前提:

假设交易的可能性:

  1. 最近交易过的客户 > 最近没有交易过的
  2. 交易频率高的客户 > 交易频率低的
  3. 交易金额大的客户 > 交易金额小的

二.分析实践

RFM接受的数据格式有两种:

  1. 交易数据:每次交易占用一行,关键变量是客户ID、交易时间、交易金额。
  2. 客户数据:每次交易占用一行,关键变量是客户ID、交易总金额、最近交易日期、交易总次数。

我们通常采用交易数据的格式进行分析。因为交易数据可以整理成客户数据,而客户数据无法还原成交易数据。即用交易数据的字段可以得到客户数据的字段,反之不行。

具体是“交易数据”还是“客户数据”根据数据源文件的格式而定。

变量:选择各个变量。

分箱化:评分的总分是多少。

保存:生成哪些新的变量,可以自定义名称。

输出:可以全部勾选,为了能全面的解读RFM分析结果。

确定后,生成了四个新的变量:

  • 崭新-得分:最后一次交易的时间间隔得分;
  • 频率-得分:交易总次数得分;
  • 消费金额-得分:交易总金额得分;
  • RFM得分:RFM得分

三.结果解读(最重要的环节)

该图主要用来查看每个RFM汇总得分的客户数量分布是否均匀。

我们期望均匀的分布,若不均分,则应该重新考虑RFM的适用性或尝试另一种分箱方法(减少分箱数目或随机分配绑定值)。

“RFM热图”是交易金额均值在RS和FS绘制的矩阵图上的图形化表示,用颜色深浅表示交易金额均值的大小,颜色越深,表示相应矩阵块内的客户交易金额均值越高。

如本例随着RS和FS的分值增大,颜色越来越深,说明客户最近一次交易时间越近、交易次数越多,其平均交易金额越高。

该图是最后一次交易时间、交易总次数、交易总金额之间的散点图。

通过散点图可以清晰直观的看到三个分析指标两两之间的关系,便于指标相关性评估。

本例中,交易总次数和交易总金额存在较为明显的线性关系,而最后一次交易时间和另外两个分析指标之间的相关性较弱。

四.RFM分析应用

为客户分组,即将三个指标分别分为“高”和“低”两种,高于均值的为“高”,低于均值的为“低”。

因此有三件事要做:

  1. 计算出各个指标得分的平均值;
  2. 将各个变量高于平均分的定义为“高”,低于平均分的定义为“低”;
  3. 根据三个变量“高”“低”的组合来定义客户类型;如“高”“高”“高”为高价值客户。

第一步,先计算各个指标的平均值。

一定要勾选平均值,否则输出结果中没有“平均值”。

现在我们得到了各个变量的平均分:3.33,2.99,3.01。

第二步,将各个变量高于平均分值的定义为“高”,否则为“低”。

按照1-2-3-4-5的步骤设置高于平均值的为“2”,也可以设置为“高”

同理去设置FS和MS。

设置后结果如下:

可以在变量设置里设置标签,1代表“低”,2代表“高”,也可以在“重新编码到不同变量”里面设置时就直接定义为“高低”,而不是“1和2”。

第三步:通过各个变量的高低组合,确定客户类型。

第三区域:可以是公式,也可以是具体的数字,其实这里就是输出结果。

第四区域:表示满足的条件。

同理在“变量设置”里对标签就行设置就行。

最终分析结果如下:

通过RFM方法,我们根据用户的属性数据分析,对用户进行了归类。在推送、转化等很多过程中,可以更加精准化,不至于出现用户反感的情景,更重要的是,对产品转化等商业价值也有很大的帮助。

 

作者:膝盖哥,是一枚“跪着提需求”的产品经理。常说“不用不用,真的不用了,我跪着就好!”

本文由 @膝盖哥 原创发布于人人都是产品经理。未经许可,禁止转载。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 花椒

    回复
  2. 请问一下数字是怎么变成文字的,怎么设置,按照设置我的就不显示呢 为什么呢

    来自北京 回复
  3. 请问资讯类工具类的用户价值怎么办?RFM模型还能套用么

    来自北京 回复
    1. 我也是做资讯类的,准备用这个做一个价值模型,我觉得什么都可以用吧,只要调整好一定的权重就可以了

      来自广东 回复
    2. 自己用SPSS做了下,了解清楚了:这里说的RFM只能用于分析对应用户在全部用户中的水平,在对应RFM等级中赋予权重,就可以得到最终分数水平了。

      来自广东 回复
    3. 资讯类的可以选取最近一次登录作为R,登录次数作为F,在线时长作为M

      回复
  4. RFM=RS*100+FS*10+MS*1 作者请问 后面100 10 1都是什么意思啊?

    来自浙江 回复
    1. 乘完后可以变成3位数字

      来自广东 回复
  5. 一周年过去了,所以有人说一下这是用的什么工具吗????

    来自河南 回复
    1. SPSS

      来自北京 回复
    2. SPSS

      来自山东 回复
    3. 你看文章的时候打瞌睡了吗

      来自上海 回复
  6. 客户类型的计算公式是什么?计算变量环节没懂,大神帮帮我

    来自湖北 回复
  7. 你这个数据是从哪里拿到的呢?

    来自北京 回复
    1. 谁说菜鸟不会数据分析(SPSS工具篇)

      来自江苏 回复
  8. 如果面对的是低频消费的群体,需要考虑身份地位因素的话rmf模型还适用吗?

    来自广东 回复
  9. RS等3个得分分别为1和2,组合有8种,但值只有4个:1、2、4、8,并没有8个数值,8种分类啊?

    来自浙江 回复
    1. 不是按照总得分分类的,具体看分项得分

      来自四川 回复
  10. 这个是什么软件哇

    来自江苏 回复
    1. 这是什么软件啊?

      回复
    2. spss

      来自安徽 回复
    3. spss

      来自安徽 回复
  11. 正在下载软件,找数据练习下。上周处理用户数据时中提出来建一个用户自动分层评级的系统,由于自己水平有限,画出来的流程感觉提出来的不是特别合理,重新学习下

    来自河南 回复
  12. 我的客户类型只能有一个值呢,要么1,要么2,就只能有一种组合显示,这里是怎么操作的呢?

    来自重庆 回复
    1. 这么巧~我也是一个正在做rfm模型的river~ 🙂

      来自广东 回复
    2. 手动按照上面那个表格分类

      来自四川 回复
  13. 软件免费吗

    来自上海 回复
  14. 这种分享太好了。干货中的干货

    来自重庆 回复
  15. 厉害了。

    来自河南 回复
  16. 希望能多一些分析方法的实操介绍,谢谢啦

    来自广东 回复
    1. 一定一定

      回复
  17. 谢谢分享干活,大牛呀

    来自广东 回复