盘点：数据分析中最基本的分析方法

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

盘点：数据分析中最基本的分析方法

LLL

2021-01-19

6 评论 16413 浏览 183 收藏

18 分钟

编辑导语：在数据分析中，有各种各样的分析方法供我们使用。复杂的分析方法固然好用，但是日常工作中经常用到的还是基础的分析方法。本文作者为我们介绍了六种常见的分析方法，如果你能熟练的使用它们，相信能够解决许多的日常数据分析问题。

日常数据分析中，尤其是业务分析中，常用的分析方法论主要是几大类，本文会介绍我认为比较关键的六大类常用方法，熟练地混合交叉使用这六大类基本方法，80%的日常数据分析问题都能解决。

下面我会介绍这些方法有哪些，并且给出实例介绍如何使用这些方法。

一、多维分析

所谓多维分析就是细分分析，做多维分析首先要明确2个方向：维度和指标。

指标：指的是用来记录关键流程的，衡量目标的单位或方法，如DAU、留存率、转化率等。
维度：指的是观察指标的角度，如时间、来源渠道、地理位置、产品版本维度等。

多维分析，就是在多个维度拆解，观察对比维度细分下的指标。实现将一个综合指标细分，从而发现更多问题。

数据分析-最基本分析方法介绍

举个实际用途的例子，KPI拆解，制定明年的KPI目标：

第一步：指标拆解，商品营收=（新用户数+老用户数）×商品订单转化率×客单价；
第二步：对指标进行多维细分，新老用户可以再细分客群，比如孕妇群体、运动爱好者、学生、白领等；商品订单可以细分商品的类型、商品的价格、商品的供应商、商品的品牌影响力等；
第三步：根据历史业务发展情况，计算不同用户维度、不同商品维度下的商品营收；
第四步：求和不同用户维度、不同商品维度下的商品营收，即为商品总营收。

在越来越讲究精细化运营的今天，多维分析的作用越来越重要，管理层通常看的是综合指标，总值，但通常这些总值无法真正地发现问题。对于一线员工将总值拆解细分，才能发现问题，找到可落地的解决问题。

二、趋势分析

有对比才有分析，有对比数据才能产生意义，所以对比分析在实际数据分析中是非常重要的一种分析手段，最常用的是基于时间的对比分析。基于时间的对比分析，主要是指同一指标在不同时间周期的对比，主要分为同比、环比和定基比。

环比是指：与相邻的上一周期做对比，周期可以是时、日、周、月、季、年等。比如周环比，指的是本周与上一周的对比；
同比是指：两个周期同一个时间点的比较，目的是追踪周期性的变化；
定基比是指：和指定的时间基点对比。

数据分析-最基本分析方法介绍

举个数据例子：如2017年10月的月同比，指的是2017年10月和2016年10月做对比，而2017年10月的月环比，指的是2017年10月和上一周期2017年9月做对比。

三、转化分析法（漏斗分析）

转化分析也叫漏斗分析，主要是分析分析产品流程或关键节点的转化效果，常借助漏斗图展现转化效果。

漏斗图是一种外形类似漏斗的可视化图表，该方法可以直观追踪产品的整体流程，追踪业务的转化路径，追踪不同生命阶段下的用户群体表现。漏斗分析常用的场景主要有：

产品流程的关键路径转化追踪，比如电商常用的购买流程；
业务价值路径的转化流程追踪，比如常用的AARRR模型的价值转化追踪；
虚拟流程类指标追踪，比如按生命周期区分的不同生命周期阶段的用户流转形态追踪。

举个例子，针对AARRR模型转化场景：

AARRR是Acquisition、Activation、Retention、Revenue、Refer这五个单词的首字母缩写。它主要阐述的是用户从获取到激活，到留存，到产生营收，到口碑认可正向传播的一系列闭环效应。

我们可基于用户量计算出这些节点的转化率，从而判断哪些节点的转化率差，哪些节点还有优化的空间，再通过具体的运营手段来提升节点转化率。如下图中的活跃购买率仅33%，是否可以运营手段将其提升到40%呢？

数据分析-最基本分析方法介绍

四、公式拆解法

所谓公式拆解法，就是对目标变量用已知公式进行拆解，从而快速找到影响目标变量的因素。公式拆解法没有固定的标准，一个目标变量在不同的场景下或者说为解决不同问题，需要利用公式拆解的细致程度也不一样。

常见的公式拆解的场景有：

1. GMV计算

GMV = 下单用户量*客单价

=（新用户+留存用户+召回用户）*客单价

= （广告触达量 * 转化率 + 老用户*留存率 + 召回触达用户量 * 召回率）* （商品量*商品单价）

2. ROI计算

ROI = 收益/成本

=（销售单价*销售量）／（固定成本+可变成本）

（收益和成本也可以继续根据业务进行拆解）

3. DAU预估

A(n)：第n天的新增用户；R(n)：第n天的留存率

DAU(n) = A(n) + DAU(n-1) * R(1)

= A(n) + A(n-1) * R(1) + DAU(n-2) * R(2)

= A(n)+A(n-1)R(1)+A(n-2)R(2)+… …+A(1)R(n-1)

4. 净资产收益率ROE

ROE = 当前净利润／当期平均净权益

= 利润率 * 总资产周转率 *财务杠杆

= 净利润／销售收入 * 销售收入／总资产 * 总资产／权益

根据公式对目标变量拆解后，我们通常会对拆解后的变量做更精细的分析，并且提出可落地解决问题的解决手段。

如下图所示，这是电商／零食行业最常用的拆解解决问题的框架，为提升销售额，在实际解决问题中都要细化到广告拉新、用户分析、商品分析等层面。

数据分析-最基本分析方法介绍

五、综合评估法

综合评估法是将多个指标综合成一个指标评估的方法。这种方法是非常常见的，如我们日常中的蚂蚁信用分、微博热度、游戏战绩排名等都是基于综合评估法实现的。

综合评价法的特点表现为：

评价过程是通过一些特殊的方法，按指标的重要性对多指标加权，多个指标的评价是同时完成的，而非一个一个逐次完成的；
在多指标整合进行综合评价指标的过程中，会涉及权重的设定；
综合评价法生成的综合指标不再是单纯意义上的单个指标的意思，而是多个指标的综合反映。

因此，对于综合评估法，赋权是非常重要的环节。而赋权的方法可分为两类：主观评估法和客观评估法。客观评估法是指：变异系数、熵分析、主成分分析等；主观评估法是指：层次分析法、专家赋权等。

1. 变异系数法

变异系数等于样本标准差除以样本均值，是衡量样本观测值变异程度的变量。而且因为变异系数是除以了样本均值，所以他是忽略了量纲的影响。那具体如何用变异系数定权重呢，具体步骤可以看下面：

第一步：对于每一个指标计算变异系数cvcv_i=样本标准差/样本均值= σ/μ

第二步：计算各个指标最终的权重

基于以上的计算公式可以看出，对于变异系数法定义权重，如果一个指标可以明显区分不同的样本，那么就会有更高的权重；反之，如果样本在某个指标的表现上没有特别明显，即该指标区分样本的能力较弱，则应该给这个指标赋予比较小的权重。

2. 熵值法

熵的概念来源于热力学，后来被引入信息论，用以表示对不确定性的一种度量。信息熵一般用来反映信息量的大小，信息量越大，不确定性越小，熵就越小；反之，信息量越小，不确定性越大，则熵就越大。

信息熵的计算方式如下：

假设有随机变量X，对应的值分分别为x1, x2, …, xn对应的概率分别为pi，信息熵为：

数据分析-最基本分析方法介绍

具体基于信息熵计算权重的方法步骤如下：

第一步：计算指标的比重假设有n个样本，m个指标，xij为第i个样本第m个指标的值。因为不知道样本对应的具体指标的概率，可以用m指标下n样本对应的指标值占该指标总值的比率来表示。第xij指标的比重pij为：

数据分析-最基本分析方法介绍

第二步：计算第j项指标的熵值

数据分析-最基本分析方法介绍

第三步：计算各项指标的权重

数据分析-最基本分析方法介绍

第四步：计算各个样本的综合得分

数据分析-最基本分析方法介绍

计算出的综合得分是[0,1],可通过开根号再乘以100的方式，将其映射到[0，100]。

3. 层次分析法

层次分析法（AHP）是运筹学中的概念，是指将与决策总是有关的元素分解成目标、准则、方案等层次，在此基础之上进行定性和定量分析的决策方法。

如下所示，要计算总得分，可以将其拆解为质量、互动、消费、发布、附件这五个准则，对于这五个准则有再细分的方案。

数据分析-最基本分析方法介绍

那具体怎么定义权重，大体思路是：由专家分别在每一个准则的细分方案下，对细分方案两两之间评重要程度（如1-9，1是同等重要，9是一方极端重要）。

再基于重要程度，可通过层次分析法的计算公式计算出每个细分方案的权重；同理可对五个准则进行重要评估，从而计算出五个准则的权重。具体方法可百度，百度上有详细的计算公式。

六、结构化分析

所谓结构化分析，其实就是逻辑树和MECE的结合使用。

逻辑数是麦肯锡推广的思考问题的工具，就是将目标问题像树一层一层拆解，最左边是“树根”（目标／问题的起点），朝右是将某已知问题的影响层当成已知问题的树枝，每多一个影响层，则添加一个树枝，直到列出已知问题的所有影响层为止。

且各逻辑树枝之间的关系需要“相互独立、完全穷尽”（MECE）。

结构化分析是非常好用的一种方法，它能将问题层层有序拆解，有助于思路清晰，同时可以将复杂问题由繁化简。下面以一个应用场景来举例说明：

比如要分析某App用户流失的原因，穷举用户流失的影响因素，做出逻辑树。

数据分析-最基本分析方法介绍

虽说结构化分析非常好用，但是构建一个完美的框架（逻辑树）可不是一件容易事，一般构建结构框架有两种方法：自下而上和自上而下。

1. 自下而上

自下而上的意思是：先头脑风暴罗列可能的影响因素，再对罗列的影响因素归类分解形成框架。

数据分析-最基本分析方法介绍

下面以一个应用场景来举例说明，比如如何在2年内赚到100万元？

1）第一步：罗列要点

数据分析-最基本分析方法介绍

2）第二步：连线归类

一般是从时间、结构、重要性三个维度进行归类。

3）第三步：形成框架

数据分析-最基本分析方法介绍

4）第四步：检查是否有重复和遗漏

2. 自上而下

自上而下的意思是：已经有可套用解决的框架，将需要解决的问题按照框架拆解，最后形成针对目标问题的结构框架。现有的成熟的框架特别多，比如4P、4C、SWOT、PEST、5W2H等等。

数据分析-最基本分析方法介绍

3. 自上而下和自上而下对比

从上面的讲解很容易看出两种构建框架的区别，具体的对比整理如下，日常中可为了提高框架输出能力而有针对性的训练。

数据分析-最基本分析方法介绍

以上就是我要介绍的常用数据分析方法，掌握上述方法，我相信80%的数据分析问题都能得到合理的分析思路。但在实际场景中，很少仅用单一方法就能直接解决问题，大多数情况下都要综合上述方法中的多种方法才可。

比如电商场景下的如何提升销售额问题？就要用到公式法、转化分析法、多维分析法及结构分析法，经过这样一系列分解才能获得可落地化的解决方案（公式拆解法里贴的示例图就有比较详细的逻辑拆解过程）。

本文由 @须臾即永恒原创发布于人人都是产品经理，未经许可，禁止转载

题图来自 Unsplash，基于 CC0 协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

LLL

互联网数据分析师

5篇作品 144628总阅读量

05-299225 浏览

12-263565 浏览

02-061650 浏览

03-153763 浏览

08-252347 浏览

黑兔子

这些公式看不懂，太烧脑，也说明博主写的很专业

最近来自北京回复
阿甜有点甜

请问结构化分析法是不是就是社邦分析法呀

最近回复
1. 我是谁回复阿甜有点甜
  
  杜邦分析法
  
  最近回复
阿甜有点甜

很棒！！

最近回复
林晓菊🍸Helen

作者这篇文章有理论，有案例的将数据分析方法讲得通俗易懂，学习到不少，谢谢了

最近来自广东回复
多利酱

学习了感谢~~

最近来自河南回复