一文搞懂数据异常问题该如何分析
编辑导读:数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当出现了数据异常波动的情况,应该如何进行分析呢?本文作者对此发表了自己的看法,与你分享。
一、数据异常波动的表现形式
数据异常监控分析不仅是数据分析面试中的高频考题,同时也是业务分析中一项常态化的工作内容。当我们面对市场、产品、运营等各种业务场景,经常会发现很多异常数据的问题,比如:
- 某APP日活DAU相比昨日突然下降了10%,该如何分析?
- 某公司销售收入环比上月下降了15%,该如何分析?
- 某产品客单价环比上月下降了20%,该如何分析?
- ……
上述各种业务场景,其实都是发现了数据有异常波动的情况,那接下来问题来了,我们该如何着手进行分析呢?大部分人解决问题的思路,都是直奔主题找原因,上来就去找出现异常的原因、异常点在哪里。其实这种分析思路有一个最大的弊端就是不够体系化,往往能够找到一些原因,但是很可能是片面的,甚至可能还会踩雷。接下来就给大家分享一种比较实用的方法,我个人称之为“点 – 线 – 面”分析法。
二、数据异常分析的方法论
1. 点
首先排查数据准确性,确定是否属于数据错误。容易出现数据错误的环节有数据采集环节(埋点)、数据提取环节、产品环节(BUG)、业务环节(数据口径)等。如果没有问题进入下一步分析;
2. 线
拉长时间周期,也就是进行纵向分析,看是否属于周期性波动,有些行业受季节或淡旺季影响较大,比如家电、饮料、在线教育等都受淡旺季影响较大。如果没有问题进入下一步分析;
3. 面
首先,综合运用公式拆解法、多维度拆解法等对大问题进行拆解,拆解为一个个可着手分析的小问题;然后,通过计算影响系数初步定位到主要影响原因;最后,大胆假设,小心验证,通过假设检验法逐步排查到产生问题的根本原因。
比如,我们以销售收入下降为例,通过“点 – 线 – 面”分析中的“点 – 线”分析确认属于数据异常后,接下来就可以在“面”的分析环节中采用“三部曲分析”法,主要流程如下:
1)运用公式拆解法、多维度拆解法等对大问题进行拆解
2)计算影响系数,定位主要原因影响系数=( 细分项本月数 -细分项上月数 ) / ( 本月总量 – 上月总量 )
影响系数越大,说明该维度数据就是造成总体波动的主要影响因素。
3)通过假设检验法逐步排查根本原因
假设在计算影响系数后,初步确定主要是新用户减少引起的收入下降,接下来就需要对新用户数下降的原因进行假设,常见的假设维度有内、外部维度,其中内部维度主要有渠道侧、产品侧、运营侧、技术侧等等,然后通过数据逐一对上述假设进行验证。
以上是几种常见的拆分维度,通过初步拆分,定位原因大致范围。
三、数据异常分析的案例实战
某连锁零售集团最近两年每月销售收入保持稳中有升的趋势,但是在2021年6月销售收入突然下降了17%(下图),这时销售负责人非常着急,让你尽快排查一下销售下跌的原因。面对收入下降这种棘手的问题,如果对于没有经验的同学,确实还是比较头疼的,就像那烫手的山芋,无从下手。
接下来,我们就按照按照上面的套路来演练一下。
1. 点
首先排查数据准确性,确定不属于数据错误;
2. 线
拉长时间周期,不属于季节波动;
3. 面
1)首先把总收入拆分成新、老用户收入
如下图:
通过观察数据,发现新、老用户收入均有不同程度下滑,于是启动第二步,分别计算其影响系数。
2)计算新、老用户收入影响系数
新用户收入影响系数 =(33 – 47) /(100- 120) =0.7
老用户收入影响系数 =(67 – 73)/(100- 120) =0.3
新用户收入影响系数0.7,说明总收入下降主要影响因素是新用户收入下降,明确问题的范围后接着进行细分,新用户收入的构成是什么?
新用户收入 = 新用户数量*转化率* 客单价
通过调取数据分析发现,新用户转化率和客单价都保持稳定,那么问题就出在了新用户数量这个指标上,那新用户又是由什么构成呢?
新用户 = 渠道 1 + 渠道 2 + 渠道 3 + …… + 渠道 n
于是我们把新用户按照其渠道来源进行拆分:
通过对新用户渠道来源进行拆分,我们发现渠道1在2021年6月新用户数量下降非常严重,于是我们就定位到收入下滑的根本原因在于渠道1新用户数量下滑严重。接下来我们就可以启动第三步,对渠道1新用户数量下滑原因进行假设检验。
3)对渠道新用户数下滑原因进行假设检验
渠道流量下降可能的原因可以从两个大的维度进行考虑:对于外部维度,可以考虑外部环境变动、竞品变化等;对于内部维度,可能的原因有渠道线索问题、投放策略变化等。这个时候一方面要调取数据进行分析验证,另一方面需要联系渠道1的负责人一起定位具体原因,找到具体原因后,再对症下药。
本案例纯属虚构,如有雷同,纯属巧合。当然,实际的业务要比这复杂的多,需要考虑的因素也很多,花费的时间也会更长。但是,解决问题的方法论和流程是可复用的。相信大家以后再面对类似问题的时候,会有一个清晰的分析思路和明确的入手点。
最后,我们如果对上面的“点 – 线 – 面”分析法进行总结归纳的话,可以提炼为下面这张图:
希望这一篇能够对大家准备面试和实际工作有切实的帮助,如果同学觉得有帮助,欢迎点赞、转发啊!大家如果有其他想法,欢迎加入我一起讨论交流。
本文由 @知了数据分析 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
微信公众号:知了数据分析
本文由 @知了数据分析 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
关注【知了数据分析】,获取更多数据分析干货!