数据分析,怎么做才能有前瞻性?
老板嫌你的数据分析没有前瞻性,总是在分析大家都知道事情。面对这种情况,你需要转变思维,换一种数据分析方法了。
有同学问:领导总让做“有前瞻性”的分析,不要说那些“大家都知道的事”。
可到底什么是前瞻性?
有时候明明写了预计未来情况,可还是被批判为:没啥前瞻性,真不知道咋办了。
先看看一个简单的例子如下,看图回答问题:6月的GMV是多少?
有多少同学是脱口而出“400”?
常见的问题,就从这里开始。
没有前瞻性的分析,长这样
错误一:复读机型
看到上图数据,写出来的是:
月均GMV720
最大值1000
最小值500
中间值700
这肯定没有任何前瞻性,这根本就是把图表又用文字复读了一遍。只要业务方不是瞎子,能看到数字,都会觉得这没啥意义。
错误二:惯性思维
还是上图数据,你认为6月的GMV是多少?
有多少同学是脱口而出“400”?
——这就是典型的惯性思维。
其实,只有一年的数据完全不说明问题,但是人们就是会很惯性地认为:过去跌的就一定跌,过去涨的就一定涨。特别是出现这种5432顺序排列的数据,惯性得就会认为下个数字是1。
其实,这正是数据分析要打倒的大敌。如果我们引入过往年份数据,很有可能曲线长这样:
这时候还有谁说6月是400?很有可能1-5月的只是正常的业绩波动而已。
所以,单纯用惯性思维判断,完全没有体现数据分析的价值,做的结论还极有可能是错误的。
错误三:习以为常
还是上图数据,很多同学看了三年趋势,然后脱口而出:因为过去6月份会涨,所以今年6月份也会涨。
这种说法,很有可能被业务评价为:我早知道了!你分析了啥?
因为历史规律,特别是这种宏观迹象这么明显的规律,是个人只要不瞎都看得到,说出来当然没啥意思。况且,谁说去年涨,今年就一定涨?万一今年涨的少,甚至跌了呢?仅凭一根线又怎么判断呢?
真正的前瞻性,是定性预测
本质上,所谓的前瞻性,是需要我们做一个定性预测。
虽然没有精确的数据或模型,但是能通过分析,判断未来走势(相对应的,建数据模型详细计算的是定量预测)。
做预测的关键,是找到影响未来的因素。
这些影响因素,才是支撑指标曲线的真正支柱。支柱倒了,指标自然下跌;支柱稳固,指标自然高企。
所以,想做好预测,不能只对着数据本身就数论数,而是得找到数据背后的原因。
比如,上图中6月,11月大涨,可能有几个原因:
- 行业因素:行业本身就是夏季、冬季前有一波高峰(比如旅游相关机票、酒店、住宿,赶在寒暑假前大量预定);
- 促销因素:618,双11是主战场,要拼命做大GMV<;/li>
- 产品因素:这个行业每年6,11月上新品;
- 其他因素。
在做预测之前,我们要先了解业务,掌握影响因素。
根据影响因素的可辨识程度,大致可分成三类,我们一类一类来看:
第一类:宏观事件型
宏观事件往往备受关注,媒体会大量报道,因此辨识度很高。但相应的,辨识度越高的东西,讲出来价值就越低。
因此,在做定性预测的时候,提及宏观事件,是个必选项。提了,不一定被认可;不提,一定被视作“你都不懂业务”“这么明显都看不到”。
有些坏习惯会影响做数据的同学关注到宏观事件。比如,很多做数据分析的同学只看数据类文章,反而每天沉迷在数字和代码里,对行业发生了什么都不知道。这样一来,当然很容易被批了。
需注意,之所以是定性预测,因为很多宏观因素的影响可能无法预测。
循环出现的,可以看过往的历史规律(比如节假日影响、行业周期性波动);但是个案出现的,就很难去预测。比如,突然出台新政策,禁掉了某些业务。
无法预测效果,只能去研究政策细节,看看到底影响面有多大,做个预警。
第二类:投入产出型
投入产出型事件,往往是大家都知道有影响,但具体影响多少不清楚,这时能体现一定的数据价值。
有前瞻性数据支持,可以方便业务安排活动,也能准备相关人力物力资源(比如做促销,商品、客服、服务器流量,有可能都要准备),这种前瞻性是非常有帮助的。
计算投入产出的常用方式有三种(如下图):
需注意的是,很多同学一提“活动效果预测”,就急匆匆想建模型或者做抽样,用第二、第三种方法。在现实中,只有封闭了信息渠道的营销活动才适合这么干(而且需要余留较多时间准备数据)。
很多促销活动,比如双十一大促、周年庆大促,因为宣传规模太大,会产生滚雪球效应。用看似精准的方法预测的反而会偏小、失真。比如,新产品上市,可能在上市前完全保密,也没法做太精细的分组测试。
所以,做定性预测的时候,第一种方法用的更多。
投入产出型事件分析还有个用途,就是前瞻性指出问题。我们都知道,业务部门干事情不见得是为了效益最大化,很有可能有政治任务,比如:
- 老板要大力转型新零售,所以非得强迫客人微信下单;
- 我们的KPI是抓老用户,所以效果不好也得强行做;
- 部门费用不够了,但活动还得做,所以券全部面额减半。
这时候,如果有过往分析经验指出:
- 微信下单就是垃圾,影响销售;
- 老用户响应率就2%,咋做都是死;
- 面额减半,响应率不是减半而是减3/4。
前瞻性指出问题,就能提醒业务部门注意风险,也不要在事后纠结“到底是什么原因做得不好”。
只不过,这种前瞻性虽然有价值,但不一定受业务欢迎(还有可能吃板砖)。大家在实操中见机行事,量力而行。
第三类:内部结构型
再深层次的看这个问题,就是所谓的自然增长率,根本是不存在的。
在数据上看,可能指标“自然”就会涨;可在业务上看,所有的增长,都是在XX条件下的增长(如下图):
除了宏观环境外,产品,促销,用户基础,用户分层这些,就是预测需要的XX参数。参数的情直接决定了业绩的走向。
所以,当内部影响因素发生结构性变化的时候,自然业绩会发生变化。只是很多内部结构性变化是慢性的、持续的、微观的,所以难以观察。
这就需要深度分析,不止关注整体趋势,更关注构成整体的各个因素的结构。
内部结构型问题很难前瞻,难在到底是个案还是趋势,很难在一次分析中观察到。比如,我们总是说:渠道下沉,新生代需求变迁,兴趣转移等等概念。可真具体到某一月某一日的数据上,你真把特定群体抽出来看,反而数据上差异不大。
有时候自以为观察到一个变化,可持续看几天,丫又消失了……短期内,永远是宏观事件&投入产出型影响占主导。
所以,想要观察到一个内部结构变迁的影响,需要长时间观察。
小结
看完三种类型,大家会发现,领导们想看的,都是第三类问题。
通过细致的分析,看到深层次问题,讲出来没人知道的惊天秘密——听起来多厉害,可实际上没那么理想。
业绩指标的波动,从来都是多种因素综合作用的结果,也并非每次变化都一定有深层次的原因,有可能就是自然波动、某个产品/活动做烂了、没钱还装逼,道理就这么简单。
能区分出来关键因素,提示问题才是重要的。
所以,数据分析的价值,不是神神叨叨地讲没人知道的秘密。
- 了解业务,区分事件;
- 能量化的,量化预测;
- 不能量化,评估范围;
- 做好监控,提示问题。
以上都能做到了,就是最好的前瞻性。
当然,有同学会问:有定性的预测,那有定量的预测吗?
当然有,而且有不止一种做法,不止一种算法;有兴趣的话,后续再继续分享。
作者:接地气的陈老师,微信公众号:接地气学堂。十年资历的数据分析师,做最接地气的分享。
本文由 @接地气的陈老师 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
可能没有接触过相关的数据分析吧,有一点代入不进去的感觉?
愚钝了愚钝了
最后一个内部结构型感觉不是很清晰。意思是要看具体的影响因素的变动吗?