干货 | 从业5年,我总结了一套数据分析的实用方法论

18 评论 24576 浏览 271 收藏 13 分钟

本文作者基于自己的经验,总结出一套标准的数据分析方法论,帮助行业内的小伙伴更清晰的知道该如何做一个完整的数据分析。

写在前面

数据分析是所有产品经理的必备能力,也是折磨各位产品经理最痛苦的一件事情。

  • 上线前,老板会说:做一个数据分析?评估下预期。
  • 上线中,功能表现的不理想,老板会说:数据往下掉了,做个数据分析看看为啥?
  • 上线中,功能表现的好,老板会说:做的不错,做个数据报告统一汇报一下。

OMG,你看,不会数据分析,寸步难行!

当然互联网上有非常多数据分析的心法和教程。我大概总结了一下大致有两类:

  • 一种是偏纯理论形式的;比如如何用spss做主成分分析,专业高大上,怎样应用勒?完全没有时间系统学习有木有!
  • 一种是偏形而上的,告诉你数据分析,首先要基于数据调研,然后数据验证巴拉巴拉的,给你一种道理都懂,依然过不好这一生的错觉。

因为自己从业数据产品多年,数据产品的一个基本工作就是把分析结论抽象成数据产品,帮助业务进行数据洞察。所以,自己也大大小小做过非常多的数据分析。我就在想,是否可以基于自己的经验,总结出一套标准的数据分析方法论,帮助行业内的小伙伴更清晰的知道该如何做一个完整的数据分析。

当然,这次对自己的这套方法论也有一些自我要求:

  1. 一定要从实际出发的那种,要有一个案例贯穿始终;
  2. 一定要有可复用的结论,并且是不形而上,夸夸其谈的那种。

于是乎便有了此篇文章,本文将以外卖流量分配分析作为案例,深入讲解如何完整的做一个数据分析。

目录

1.数据分析-定义问题

2.数据分析-梳理分析框架

3.数据分析-规范数据内容

4.数据分析-规划分析方法

5.数据分析-输出分析报告

6.总结

定义问题

数据分析的本质是解决某一个业务问题。

解决业务问题的前提,一定要想清楚两件事情:

  1. 理解问题:想清楚这个问题到底是什么
  2. 定义问题:用数据拆解出这个问题

我见过太多小伙伴做数据分析的时候,根本就没搞明白为什么要分析?要分析的这个问题到底是什么?所以在分析之前,一定要花时间了解这个数据分析到底解决了什么问题。

这个问题,在定义清楚后,需要和业务方、leader去反复沟通,直到对这个问题清楚的达成共识。

以外卖流量分配举例:

(1)理解什么是流量分配?

从市场收回到外卖业务来看,流量分配其实和布局市场的本质是一样的:通过更有效的分发商品、更合理的摆放商家,让用户与商户进行更有效率的交易

那么,如何更有效的分发商品?如何更合理的摆放商家呢?

需要通过一套分发机制去实现,而分发机制必须依赖于分发渠道去实施。

具体来说,分发渠道可以看做我们线上产品的流量渠道。该有哪些流量渠道,流量渠道里该摆放哪些商家,是我们考虑的重点。

流量渠道作为分发渠道,起到连接商家与用户的作用,同时也是对用户需求及商家供给进行配对。如下:

  • 用户群体1——渠道1­­­商家1、商家2、商家3
  • 用户群体2­­­——渠道2­­­商家4、商家5、商家6
  • 用户群体3­­­——渠道3­­­商家7、商家8、商家9

流量渠道是为分发机制服务的通道,每一个流量渠道必定有不同分发机制的含义。比如:搜索入口,以搜索关键词为分发机制,建立用户需求与商家供给的匹配。

综上所述:站在平台看流量分配是一件什么样的事情?

以流量渠道作为媒介,通过资源配置实现用户与商户进行更有效率的交易,平台需要做两件事情:

  1. 分对人(匹配需求):把合理的流量渠道分配给需要的用户群体,即为现在进行的精准化营销,千人千面。
  2. 配对货(匹配供给):每一个流量渠道里分配满足这个用户需求的商家。

(2)用数据定义流量分配

首先,思考如何去定义流量?

一般而言,流量是指在某一时间某一地点某一会话从来源到去向的全过程。

其次,思考我们用什么指标去有效的衡量流量:用dau衡量?用页面去重uv衡量?还是用什么去衡量?

从业务的角度来看,我要统计一天内产生了多少的流量,代表我要统计有多少次用户使用过我的产品。

每日流量,本质上为每日会话数=每日用户数*日均用户使用频次。

最后,思考我们该从哪些角度去衡量流量?

拆解来看,如下表:

关于外卖流量分配的具体思考,可以参考另外一篇文章,里面会有对流量分配的详细定义及思考:搭建流量分配体系,这里不再详细赘述。

梳理分析框架

知道了数据分析的问题是什么后,需要我们去基于这个问题,梳理一个数据分析框架。在这个分析框架里,我们需要明确分析内容的数据范围以及要分析哪些问题。

(1)明确数据范围

数据范围一般分为空间范围与时间范围;具体如下:

(2)规划分析框架

基于定义问题环节中对问题的理解,用详细的数据拆解问题,并把这些问题进行归类形成框架。

基于外卖流量分配为例,框架截取如下:

规范数据内容

有了数据分析框架后,需要对数据分析框架里的数据进行详细定义规范,确保每一项数据的统计口径是准确无误的。

数据内容主要分为:

1. 指标维度定义

详细定义数据分析框架中的每一个指标含义,形成指标字典。这个指标字典的作用,一方面作为需求文档,是与数据开发评审的依据;另一方面,是一份释义说明,作为分析报告中指标说明的出口。

基于外卖流量分配为例,截取部分指标说明如下:

2. 指标维度矩阵设计

需要把指标维度用一个矩阵的方式呈现出来,如果该指标在该维度上有关联,则打勾。

指标维度矩阵的作用是明确指标与维度的关系,也可以帮助我们复验所有指标与维度的关联是否可以满足我们的分析需求。避免后期造成如下badcase:我想从地域的角度观测交易金额指标,却发现取出的数据中,交易金额不支持地域维度的下钻。

基于外卖流量分配为例,截取部分指标维度矩阵如下:

规划分析方法

接下来基于分析框架,明确每一个分析问题,需要采用什么样的分析方法进行分析;详情写出分析的标题、度量内容、可视化方法、分析方法,并按数据分析报告(以PPT为例)展示的顺序组织。

基于外卖流量分配为例,截取部分如下:

那我们到底该选取什么样的可视化方法去呈现我们的报告呢?这里参照国外大神的经验,总结了一个万能图表,供大家参考:

完成分析方法的规划后,我们就可以形成一个数据分析的提纲,这个数据分析提纲是非常重要的:

  1. 清楚的阐明我们需要分析的问题。这些问题并不是凭空想象的,而是基于定义问题环节、搭建分析框架环节的逻辑推导得出。
  2. 清楚的知道分析问题中需要的数据内容。
  3. 有一个完整的画面感,明确数据分析最终呈现的样式。

以PPT展示形式为例,甚至可以知道这个报告有多少页,每一页都有哪些内容。

输出分析报告

这样,我们基于以上的准备,就可以按部就班的去输出我们的分析报告了。

我在这里的建议是,一定要把任何一个数据分析当成自己的作品一样,高标准高要求的进行产出。这样,不仅可以锻炼我们的撰写报告能力,也可以更好的让业务方对你形成专业可信赖的印象。

基于外卖流量分配为例,截取分析报告如下:

备注:以上所有具体数据均经过虚构处理,请勿作为行业参考

总结

如上以外卖流量分配为例,详细介绍了数据分析的全流程。最后,对数据分析的方法论总结如下:

写在最后,数据分析是每位产品小伙伴日常离不开的一项工作任务。期望这篇文章,可以帮助大家更系统的思考我们做数据分析的目的和流程,如果有好的建议可以留言交流。

欢迎各位小伙伴订阅关注,一位与数据相爱相杀多年的数据产品汪敬上~

相关阅读

数据产品的工作本质是什么

如何基于数据统计业务

 

本文由 @ 罗大大 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unspalsh, 基于CC0协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 世上的感情还有最多的一种,他不爱你你也不爱他

    回复
  2. 都说数据分析完要产生结论,有时候我分析完不知道要怎么指导业务,并不是业务不熟,是不知道怎么着手?这个有好的办法吗?

    来自北京 回复
  3. 方便加个微信吗😂,本人想做数据产品经理,但一直没有体系化的入门学习

    来自重庆 回复
    1. 有的,你没有找到~
      数据产品经理实战训练营就是起点学院出的,你添加qidianxiaoshi咨询就可以啦~
      我刚好在上第一期课程

      来自广东 回复
  4. 终于读到了第二篇流量分配体系的文章,但是这篇属于流量分配报告,有流量分配系统么?就是流量分配系统,管理了像您说的站外流量渠道,站内流量渠道,这些渠道的用户标签。系统中还有商品标签和店铺标签,流量分配系统中可以对这些标签进行AI学习,也可以人为干预,比如某些新品质优价廉,我可以给它提供能过的流量分配?

    来自北京 回复
  5. 感谢分享,非常有用!!

    来自湖北 回复
  6. 感谢收藏~

    来自北京 回复
  7. 我认为的流程是:定义问题->规范数据内容->梳理分析框架->…
    因为先整理数据内容(指标维度定义及矩阵),在梳理分析框架的时候就可以根据这些【指标】进行【维度】发散详细分析。
    如:你这里的 [按照品类分析]、[按照地区分析] 都是属于【维度+指标】分析

    来自广东 回复
    1. 一个有趣的思考,数据分析就像是做一道菜;
      1.定义问题像是定义要做什么菜;比如宫保鸡丁
      2.数据内容像是原材料
      3.分析框架像是菜谱
      我理解先要有菜谱,才能去菜市场(指标字典)中去选取自己需要的菜;而规范数据内容就像是洗菜切菜。
      这里的逻辑取决于:是先有菜谱,再按照菜谱去买菜?还是先把一大把菜买好,在去想怎么做?可能前者的效率会更高~
      一些见解,欢迎探讨~

      来自北京 回复
    2. 您这套流程可以更适用于:
      对业务场景很熟悉,熟悉有哪些指标与维度,能很快把握分析的方向。
      ———————————————————
      而对于我这种做数据入行不久的人小白来说:
      先列出数据字典,可能可以启发我对数据分析方向的思考,比如可以从哪些维度进行下钻,再去拆解问题。

      🙄 我还需要慢慢成长。

      来自广东 回复
  8. 属实晦涩难懂,过度堆砌辞藻,简单问题复杂化

    来自广东 回复
    1. 多谢支持,有好的见解欢迎沟通~

      来自北京 回复
  9. 新增会话数的指标定义,是“若历史无UUID,算作新增”,还是“若有算作新增”?
    多谢

    来自江苏 回复
    1. 若历史无UUID算作新增~

      来自北京 回复
  10. 感谢分享,订阅了!

    来自广东 回复
    1. 多谢支持!

      来自北京 回复
  11. 沙发!码住!

    来自北京 回复
    1. 多谢~

      来自北京 回复