做数据分析,99%的人读不懂这张图
做数据分析时,很多人只是通过数据就数论数,止于数据,并没有读出数据背后的业务意义。那么,我们改如何通过数据了解其深层次含义?对此,本文从错误的数据解读示例、解读的关键时理清业务含义等七个方面做了分析,推荐对数据分析感兴趣的小伙伴阅读。
经常有同学抱怨,在公司里,总被催着问:通过数据,你看到了什么?可实际数据就几个曲线而已,也不知道咋解读。也没有人教,自己好不容易写了几句,又被嫌弃:“你这都是废话,我们要深层次含义”。咋办?就举个最简单的例子,下边是某公司一周销量数据,你看到了什么?
一、错误的数据解读示例
- 高了表扬低了骂。数据解读,写的是:周一到周五很高,周六、周日低,所以要!搞!高!……这么解读当然会被说:你这都是废话啊!业务又不是瞎子,看不到数字是周六日低吗。
- 哪里跌了哪搞高。因为周六跌了48%,所以要搞高……这个是废话*2和上一种说法是一个模子里刻出来的。
- 加减乘除算不停。平均值95.2,最大值125,最小值35……这个是废话*3。平均95.2所以呢?最大值125所以呢?这还是在把数字复述一遍而已,没有讲出任何含义。
二、解读的关键是理清业务含义
以上三种错误的共同点,是:就数论数,止于数据。没有读出数据背后的业务意义。其实数据解读一点都不高深,我们每月每天都在用,比如:
业务部门做决策也一样。他们想听的是:不划算、不喜欢、买不起。他们更想听的是:“今天中午预算只有人均50,在这家川菜馆既管饱又好吃”,他们想听的绝不是“2公里内共28家餐厅,平均价格63元,最高价725元,最低价13元,较上个月价格提升了10%”——这真的是一点意义都没有。
想要得出这种判断,需要三个条件:
- 了解数据代表的现实含义
- 了解数据大小代表的现实区别
- 明确判断标准
比如大众点评上饭店人均金额185元。它不是一个孤零零的数字,而是填肚子的成本,这是人均金额的现实含义。成本低了可以接受,高了就吃不起,这是数据大小的现实区别。比如我一个月餐费预算只有3000块,意味着每天只有100块钱,这就有了标准。那这一顿185,明天就得吃土了。这就形成了判断:太贵了,得换个地方。
解读企业数据也如此,不能只见数据,不见业务。同样三点:
- 业务含义:数据反映的是什么业务
- 业绩走势:通过数据形态,解读业务发展走势
- 判断标准:到底什么算好,什么算不好
下边我们一个个看一下。
三、从理解业务含义开始
回到开头的例子,“销售业绩”这个指标本身有很多含义。
- 直接含义:销售队伍的努力程度
- 销售业绩+成本:企业的盈利情况
- 销售业绩+产品:产品畅销程度
- 销售业绩+用户分层:用户的需求
- 销售业绩+库存:产品进销存管理质量
但是注意:这里并没有标准,因此无法判断是好是坏。这也是为什么直接下结论:业绩低了要搞高,是非常错误的行为。
销售业绩直观反映的是销售队伍的努力程度,想知道这个数值是好是坏,我们可以直接去问“销售队伍的KPI达标了多少?”;也可以从业绩曲线走势来判断。这就需要做第二步:观察业绩走势。
四、观察业绩走势
一个问题:“什么样的产品会卖出这种曲线?”因为有七天的数据,所以可能代表了三种走势:
1. 自然周期性变化
七天代表了一周,周一到周五是工作日,周六周日是休息日,所以这是一个工作日销售多,休息日没销售的产品——是滴,你很自然联想到,这可能是B2B的交易,工作日上班了才有大把生意,周日都休息了。或者是围绕B2B的衍生生意,比如CBD的餐厅一类。
2. 生命周期性变化
有可能某个主打商品销售到了生命周期末尾,正在退市,下一款新的马上要上,暂时变化。注意,一般看生命周期数据,是从生命周期开始做T+N天的图来看,不是看自然日。
3. 突发性变化
有可能刚好周六日出了问题,交易系统down机,有可能刚好促销活动到周六日结束,有可能刚好周六日恶劣天气。
通过对走势的判断,可以建立初步的标准。如果是周期性变化,那很有可能是正常波动,我们初步判做“正常”。如果是突发+下跌,那很有可能是异常且坏的波动,我们可以初步判做“问题”。有了标准,就能下判断,只是三种假设都有可能,需要进一步验证。
五、列出假设做验证
想知道自己思考的对不对,就得去验证假设。验证假设的办法有两种:第一,可以和业务部门沟通,了解实际情况。第二,可以参考过往数据,验证判断,同时反向验证业务部门是不是撒谎了。
数据验证可以做的很复杂,但也能做的很简单。不需要很复杂的逻辑,只要一根曲线就够了。如下图。
只要延长时间,靠一根业绩走势+业务表现,也可以解读出变化的原因。如果过往一直都是有周期性波动,那拉长时间就能看出来周期规律。
实际企业经营中,也经常出现上边三种情形,只是形态更复杂,往往是三种混合。比如B2C零售和B2B销售是反着的:
- 自然周期性:周五到周日高,其他工作日低;
- 生命周期性:新品上市到下市有季节性规律
- 突发事件:大促销(猛涨)恶劣天气(猛跌)
在看数据的时候,往往会在业绩曲线上打上标签,比如一个日期是否节假日,是否某重点产品生命周期结束,是否突发情况。这样,可以从看似无规律的曲线里区分出规律来。
这也是为啥很多经验丰富的业务人员,即使没有专门的数据分析,也能快速判断形势的原因。因为他们很了解业务上发生了啥事,了解过往业绩曲线形态。结合业务表现看走势,比盲目的算同比、环比、平均数,中位数要有用得多。
六、深入细节看问题
做完上一步,只是帮大家理解了数据含义,并没解答什么问题。如果止于上一步,就会变成业务的应声虫:“业绩下降是因为下大暴雨了”“这是正常波动,周末肯定要跌啦”……只是单纯的这么解读,很有可能会换来一句:“我早知道了”。
实际上,往往人们都会注意到突发性急病,容易缺失的是对慢性病的观察。比如下图:
如果只看日数据,会感觉似乎每天波动不大,只能略微感到月头比月尾似乎高那么一点。但是如果拉长看周数据,就会发现问题。为什么在业绩好的月份,最后一周不冲刺业绩了?上月业绩好+月底不冲刺+本月开局格外好,这个曲线走势不和规律,很有可能是这就是B2B销售中的“藏业绩”行为。
这时候,做数据分析的也能对一线业务说:我早知道了。甚至还能从下个月初吐出多少单,反推出来他们每个人藏了多少业绩。
这也是为啥实际企业经营中,我们不止看孤零零一个数,而是搭一个数据指标体系,还要做日报、周报、月报的原因。日报用来关联业务动作,反应突发问题,周报和月报用来追踪趋势,发现更深层次的问题。深层次的问题,再由专题分析解决。这样就构成了数据分析体系,系统化作战,才有威力。
当然,实际分析场景会更复杂。有可能经过数据解读,我们得出的是:“销售在藏单,真实业绩比数据体现的更好”这种结论,但到底是不是藏了,真实的又是多少,还得成立专项,深入分析。但无论如何,我们都比只回复一句:“要搞高!”要进步了很多,也能赢得业务的尊重。
七、解读数据是个硬技能
有同学会说:既然让数据分析师自己猜这么难,为什么不直接沟通业务的需求呢?是滴,理论上最佳的状态,是业务和数据之间有定期沟通,业务陈述需求,数据反馈结论。
不过大部分企业,这个状态不存在。大部分企业都是大家各忙各的,数据忙于爬表出数应付日常各种报表,业务忙着干活撕逼。部门之间深沟高垒,几乎没有沟通,越大的公司越是如此。
再加上,很多人对数据分析本身认识不清,还停留在“一个仙风鹤骨的道长掐指一算,口出出惊世憾俗之言”的印象中。共同作用,导致了文章开头的问题。因此数据分析师不能单纯指望业务把什么问题都梳理好了丢给自己,还是得有主动解读的能力的。
专栏作家
接地气的陈老师,微信公众号:接地气学堂,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相关经验。
本文原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
大公司10年了,实际上没有数据分析师这个岗位,这个叫BI,如果偏后端基本上主动挖掘需求和数据迭代需求,是一个精细化的过程。如果偏向前面开发基本上靠调研靠经验安排重点。如果能有联通机制,那运转起来是方便,前提是后端这边的钱是项目组发的。要不然干嘛投人力无力呢,共建是不存在的,只有用你的时候拿来主义而已。
我公司的数据分析就是单纯的呈现,不会解读和分析是否有问题