最全总结,数据分析的标准流程,收藏!

2 评论 5093 浏览 63 收藏 10 分钟

本文系统地讲解了数据分析的标准流程,包括两种基本流程和六种具体情况,以及数据分析的结果应该如何应用到实际中。如果你感觉自己做了数据分析,得到的结果却不尽人意,就来阅读本文吧。

01 从问题出发的流程

此类流程,典型有三步:问题→数据→答案,一般业务部门会沿着这个路径思考。比如你是一个销售主管,你最关心的肯定是自己业绩表现,于是你会先看:

  1. 问题1:我的团队业绩如何?
  2. 数据1:当月达标情况……今年累计达标情况……
  3. 答案1:目前已达标,超额20%。

当然,有可能你思考得更深入一些。比如公司目前有一个业绩排名奖:全国每月同比增长排名前5的团队,可以拿一笔奖金。现在已经20号了,你很想知道自己有没有机会拿到这个奖。

于是,你会进一步分析:

  1. 问题2:目前排行+未来10天预计增速,能否让我拿到这个奖。
  2. 数据2:截至19日,同比增长排行……未来10天,各团队预计完成情况。
  3. 答案2:从目前行业+未来增速来看,我能/不能拿到奖金。

注意!问题2比问题1要复杂很多,因为问题1只需要统计历史数据就好了,问题2得预测未来10天的走势。

在怎么预测上,可能有好几种方法,比如:

  • 简单用前20天趋势,模拟未来10天走势。(趋势外推)
  • 根据去年同期的走势,模拟未来10天走势。(周期性分析)
  • 根据手头尚在跟进的客户*预计转化率,推荐结果。(业务模型)
  • 根据销售人数、销售费用等数据建模,再预测结果。(算法模型)

这就是我们常说的:复杂需求。当需求变复杂的时候,数据分析的流程也会变长,主要在数据环节,越复杂的方法,需要越多的数据准备。那么,有哪些是复杂方法呢?

02 四种复杂度下,分析流程

复杂度一级:认识现状。这种最简单,直接统计历史数据即可,比如截至1月3日,今年新增加的用户数/累计完成的销售业绩;1月3日时间点上,商品库存有多少等等。注意!单纯罗列数据,并不能解释现状好坏,需要数据+判断标准,比如累计销售业绩+业绩考核标准,这样才能发现问题。

在这种情况下,数据分析流程就是:业务想了解现状→统计数据指标+判断标准→描述现状。

复杂度二级:原因分析。典型的问题,比如业务问:“为什么我的业绩没达标?”注意,此时业务有假设和没假设,处理流程不一样:

最全总结,数据分析的标准流程,收藏!

总之,想做得深入,一定要业务题假设才行,不然数据自己把指标拆来拆去,很有可能只输出诸如:“因为人数少了,所以没达标,建议把人数搞高!”一类肤浅结论。

复杂度三级:优化表现。典型的问题,比如“我要怎么做,才能让业绩冲第一”。此时,需要把前边两个复杂度的问题全部做完,才能有结论。

最全总结,数据分析的标准流程,收藏!

所以,优化表现类流程会特别长。很多数据分析师不知道怎么提业务提升建议,其实就是因为缺少了前边这几步铺垫,啥情况都不了解,肯定没法直接提建议。

复杂度四级:预测走势。在上一节已经举过预测例子,实际上,凡是预测类的问题都很复杂。起码得先了解现状,知道问题点,知道业务有没有计划做改进动作,收集一大堆信息以后才能做合理预测。

此时:

  • 如果不考虑业务动作,那么可以直接用趋势外推,分析流程就很短:业务想知道预测结果 → 观察过往趋势→按过往趋势拟合函数→直接外推结果。
  • 如果业务想考虑自己的动作,比如“我追加投入会怎样”,这时流程就复杂了,业务想知道预测结果 → 观察过往趋势→建立模型,量化投入影响→代入参数,预测结果。

总之,业务上提问越复杂,需要分析的环节越长,前期铺垫越多,不然很难输出有价值的结论。

03 从数据出发的流程

还有一种情况,就是业务端没主动提需求,但是数据分析师需要主动从数据里读出业务含义,发现业务问题。此时的基本流程是:数据→问题→答案。

但是!这个流程经常走不下去。因为很多很多数据分析师只看得到数据,对业务情况不了解。因此不知道该怎么解读这个数。比如:

  • 知道累计销售额是多少,但不知道业务考核标准,因此没法解读“好/不好”。
  • 知道销售排行是啥,但不知道业务的排行奖励细则,因此没法看出谁有潜力拿奖。
  • 知道销售不好,是因为某个产品卖得很差,但不了解产品属性,没法深入分析。

因此本篇用了很长篇幅介绍业务视角如何展开分析,就是为了提醒那些每天对着报表发呆的同学,多和业务沟通,多加深对业务背景/业务状况的了解。好在,有很多公司业务和数据沟通还是很紧密的,因此,可以优化下“数据→问题→答案”的基本流程。

  • 比如:从异动出发,数据→异常波动→业务沟通→问题确认→深入分析/问题结束。这种一般是数据分析师发现了指标异动,之后向业务确认。如果异动是业务主动发起/早就知道/已经采取措施应对,那就不再纠结,如果是意外情况,就再深入分析,直到落实问题原因。
  • 比如:从标杆出发,数据→寻找标杆→业务沟通→可复制性确认/问题结束。这种一般是数据上,发现某个产品/某个地区/某个渠道表现特别好,此时数据可以向业务主动确认“是不是一个机会点”“值不值得推广”。如果业务早就知道了,那就结束。如果业务感兴趣,就深入分析标杆可复制性,推动标杆推广
  • 比如:从部门联动角度:数据→关联情况分析→信息共享→问题确认→深入分析/问题结束。这种一般是做经营分析的时候,比如发现销售走势下滑,提醒供应注意积压风险;比如发现营销花钱很猛,关注现金流;比如发现业务计划大活动,提醒客服/售后准备。先共享信息,再看相关部门是否有应对,如果没有应对再深入分析。

以上,所有流程总结如下图,方便大家取用:

最全总结,数据分析的标准流程,收藏!

专栏作家

接地气的陈老师,微信公众号:接地气的陈老师,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相关经验。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 干货满满

    来自北京 回复
  2. 我看了很多博主的文章,分析的思路都很有价值,只是作为智慧城市产品经理,我最需要的数据分析工具是智能大屏,即能够基于现有数据智能生成一套可以讲出漂亮故事的大屏。现实的问题是:
    1.线下的数据搜集很难,并不像互联网可以轻易获得大量数据
    2.故事所需的背景信息不在系统里,通常就是会影响数据指标的政策变化或行动,开放环境下潜在的影响因素很多、很复杂
    3.数据是动态变化的,今天能讲一个好故事的大屏明天换个数可能就不好了,但是不可能实时有人跟踪分析改程序
    4.需要保障数据的一致性,局部改数据很容易露馅。

    来自北京 回复