数据分析基础思维之:指标思维

3 评论 20165 浏览 128 收藏 29 分钟

内容分为事实和观点,事实不可否认,观点则各有表达。在数据分析工作中,数据必须呈现的是事实而不能是观点,这样才能保证每个人接收到的信息是相同的。而想要保持稳定的事实能力,指标思维是不可忽略的一个关键点。

数据分析思维系列文章第一部分留了一个尾巴,还有一个底层思维——事实思维没有介绍。但是我觉得事实思维可以直接引申到指标思维,因此干脆放到一起说。

先说说什么是事实思维

我们平时表达的内容基本可以分为事实和观点两部分。

美国从小学开始教育如何分辨事实与观点,告诫学生事实不可否认,而观点则可以不认同。事实和观点混淆不清,是无法进行有效思辨和质疑的。

如果和别人辩论,对于事实,你可以用可信的证据去反驳;对于观点,则可以各自表述。

比如,当一个人说:“我觉得今天好热啊!”这就是一个观点陈述,你不能以“今天才28度,不热啊”去反驳他。因为对于说话者,28度可能就算很热了,因为各人的感受和标准是不同的。

但如果一个人说:“今年夏天比去年的温度高多了!”,涉及到事实层面的问题,你就可以拿两年温度对比的数据作为证据去反驳了。

由于中国的学校教育普遍缺失这一部分知识,所以很多中国人搞不清这两者的区别。所以中国人的沟通往往容易陷入一些无畏的争论中。

比如主管批评下属:“你怎么经常迟到!”

下属很容易抗拒,什么叫经常?我才迟到了三次,李四这个月还迟到了四次怎么不说他?然后对话就陷入了对抗模式。

“你怎么经常迟到”这句话是一个观点,代表了主管心目中的评价。如果把观点换做事实,那么沟通会更加容易。

“小张,你本月迟到了3次。”这句话是一个事实,无可辩驳,主管也没有加上评判。

这时候小张的对抗情绪就会淡化很多,更容易找出问题的根源。

数据分析工作的目的是为了提升公司的决策水平。如果不能描述客观事实,那么信息在沟通过程中很容易变形。

如果开会的时候说“本月的销售额大幅下降”这样的观点,不同的人会有不同的理解。有些人会觉得下降20%以上叫大幅下降,有些人觉得下降10%就叫大幅。

如果去掉“大幅”呢?“本月的销售额下降”这句话怎么样?

这是一个事实,但是不同的人理解的可能是不同的事实,因为没有说清所谓的下降是拿什么做对比。所以这个事实很容易造成误解。

说话者脑海中想的可能是相比上个月销售额下降了。但是有些人关注的是和去年同期相比是上升还是下降。

最清晰的事实是“本月的销售额相比上个月下降了10%”。这句话是客观事实,无法改变,每个人获取的信息也是相同的。

团队中每个人拥有相同的信息,才有可能提升决策水平。

这种只说事实不说观点的能力要求很高,人们总是喜欢情绪化的表达。印度哲学家克里希那穆提曾经说过:不带评判的观察是人类智力的最高形式。想要将事实思维融入到日常交流中,需要大量的训练。

这也是数据分析师入门容易,精通难的原因之一。

用指标描述事实

想要保持稳定的说事实的能力,最简单的办法就是把需要衡量的事物数据化。

目前互联网行业里诸如浏览量、活跃用户、响应时间等等指标的应用已经非常普遍了。每个互联网从业者或多或少都知道一些常见的指标。许多指标已经约定俗成,即使你换一家公司,甚至换一个行业,这些指标依然没有沟通成本。比如衡量用户粘性就用留存率,反应产品的流量就用日活月活。

这些基础的数据指标知识,相信你或多或少都有了解。这种基础的监控型的指标这边就不多说了,下文会附上一些常见的数据指标。

不仅指标能提升我们对业务的理解,单单是确定指标的过程,就能极大地提升我们对业务的理解。也就是说,当我们知道我们要用什么指标的时候,我们就能更好的理解业务。

刚才提到,现在的各种指标大家已经很熟悉了,比如留存率、日活用户数等等。但在时间周期拉长了看,会发现互联网行业的指标侧重点是不断变化的。

比如最早的PULSE指标体系,这些指标是用来衡量用户体验的。指标包括:

  • Page view:页面浏览量
  • Uptime:正常运行时间
  • Latency:延迟
  • Seven days active user:7天活跃用户数
  • Earning:收益

那个时代对产品的要求很低,只要能解决问题就好,所以这些指标更多地关注产品的可用性。只要确保产品能稳定快速运行,不会出现负面的体验就行了。

随后又发展到HEART指标,也是衡量用户体验的,是PULSE指标的升级版。包括:

  • Happiness/愉悦度
  • Engagement/参与度
  • Adoption/接受度
  • Retention/留存率
  • Task success/任务完成度

相比PULSE,HEART指标不单单是注重可用性,而是开始考虑到产品体验的优化。这个时候同类产品开始出现,单纯拼功能已经无法获得竞争优势,而是要在用户使用体验上优化以此获得用户的喜爱,所以增加量愉悦度、参与度等这些维度。

举个例子,原来在没有聊天软件的时候,你只要做到“可用”就可以了。但是到了后来,聊天软件越来越多,有更好体验的产品才能活下来,所以需要考虑用户的更多需求和体验,于是有了群聊、陌生人社交等功能加入。

互联网发展到现在,产品的差异性越来越小,公司之间竞争的阵地从产品切换到运营,于是近几年开始流行基于AARRR的指标体系。

  • Acquisition:获取,用户如何发现(并来到)你的产品?
  • Activation:激活,用户的第一次使用体验如何?
  • Retention:留存,用户是否还会回到产品(重复使用)?
  • Revenue:收入,产品怎样(通过用户)赚钱?
  • Refer:传播,用户是否愿意告诉其他用户?

相比之前的指标模型,AARRR站在更加宏观的全局角度审视整个产品,并且更偏向运营。

在过去,用户有自发需求,会去“找”产品。现在的用户,大部分需求都得到了满足,该找的产品都找好了,再想让用户选择自家产品,就需要通过运营手段引起他们的使用兴趣。

所以,现阶段互联网环境下主流的指标体系都是基于AARRR构建的。文章最后一个部分会介绍现有比较常见的基于AARRR的指标体系。

可以看出,确定指标的过程,不仅可以达成“说事实”的结果,还能够帮助自己梳理思路。你知道要量化什么,就说明你清楚了自己更看重什么,你对自己业务的理解往往也就更加清晰了。

如何量化指标?

日常的分析工作中,除了这些基础指标,还会遇到一些特定的业务问题,需要用数据分析解决。比如业务想对比用户对两款产品的喜爱程度,或者衡量APP的稳定性。这种情况下我们该怎么办?

曾任阿里巴巴数据委员会会长的车品觉在《数据的本质》一书中,给出了如何量化问题的方法。

想要量化某个事物,关键是要先搞清楚量化后的数据是为了解决什么问题。如果我们关心X,我们可以通过下列步骤完成量化。

首先,我们要澄清X到底是什么?

比如,你想量化用户对某个功能的喜爱程度,那么究竟什么算是“喜欢这个功能”?是使用频次吗?是使用深度吗?还是用户分享的比例?你需要不断用问题去澄清X到底是什么。

然后考虑如何量化X

如果是使用的深度,那么我们可以量化“使用深度”吗?可以用功能内的停留时长,或者各个子功能的使用广度等等。找到可以用数据衡量的指标来表示“深度”。

最后,量化后的数据能增加我们对X的了解吗?

或者说能降低我们的不确定性吗?

比如“子功能的使用广度”这个指标能让我们确定用户喜欢这个产品吗?如果这个指标比较高的用户只是用户不明白如何使用产品,而进行的探索动作。功能使用率高的用户不能代表用户喜欢这款产品,那么这个数据不能有效降低我们对产品受欢迎程度的了解。

如果量化后的数据对我们理解X没有什么帮助,那么我们就得回到第一步,重新澄清什么是X。

如果你觉得你的业务问题是无论如何都不能用数据量化的,那么我建议你看一下《数据化决策》这本书。我更喜欢这本书的英文名,how to measure anything——如何量化一切。

书中有很多精彩的例子,比如如何衡量数据的价值,如何评估一本书的阅读难度,以及婚姻带来的幸福感等同于多赚多少钱?

有兴趣的朋友,可以读一读。

好的指标长什么样?

《精益数据分析》一书介绍了什么是好的数据指标,好的指标有以下特点:

好的数据指标是比较性的

如果能比较某数据在不同的时间段,用户群体,竞争产品之间的表现,我们可以更好地洞察产品的实际走向。“本周的用户转化率比上周高”显然比“转化率为2%”更有意义。

我们现在的数据大部分都是可对比的,不可对比的数据是哪些呢?

比如一次用户调研,为各个功能的产品体验打分,最高5分,最低1分。这种数据就不容易对比。分数是4的功能相比分数是2的功能,产品体验是2倍的关系吗?显然不是。

好的数据指标是简单易懂的

如果人们不能很容易地记住或讨论某指标,那么通过改变它来改变公司的作为会十分困难。

前不久,一个朋友在交流群里问:过去90日B端用户14天内休眠比例,和B端下单用户次月留存,这两个指标用哪个好?

虽然我并不了解这位朋友的具体业务形态,但是第一个指标很明显太复杂了。如果采用了这个指标,遇到的第一个困难就是如何向团队成员解释这一指标。为什么是过去90天?为什么是14天?

如果要向领导汇报,领导还要花点时间先理解一下这个指标的含义。

相比之下,次月留存的理解成本就非常低,和团队其他成员沟通完全没有障碍。因此我推荐他用更简单的次日留存。

有些指标虽然可能更“贴合业务现状”,但是复杂的指标不利于团队协作,只有少数人理解的精准指标还不如所有人都理解的近似指标。

好的数据指标会改变行为

这是最重要的评判标准,错误的数据指标会引导错误的业务行为。现实中,最常见的导向错误行为的指标是“虚荣指标”,即数字看起来很好看,但是实际上对业务并没有什么帮助。

纯银写过一篇文章《不可靠的数字》,举了很多虚荣指标的案例。

曾经的大众点评,搞了不少“团购消费后发评论赚积分”的活动,评论数大涨,但评论质量很水,不得不用各种算法把这批低质量评论沉下去。这些业务动作的原因是美团的点评数上升很快,大众点评感到了压力。

而国外的TripAdvisor,是旅行行业巨头,在那上面去点评一家酒店,限制必须写50个汉字以上,必须写“标题”与“来访类型”,不写全就不让发。这种机制对点评数KPI是多大的伤害啊。

然而TripAdvisor是全世界最大与最具盛名的旅行点评产品,甩了第二名几百条街。

可见点评数是一个虚荣指标,虽然看起来点评多了,但是实际上垃圾信息也多了,用户体验反而下降。

年前马蜂窝被爆裁员,有人就从指标的角度进行了分析。

马蜂窝本质上是一个旅行攻略的分享网站,基本盘是写攻略 +消费攻略的人。

它的核心策略应该是增加优质内容的供给提升内容分发的效率,围绕日消费超30分钟 的以上的用户持续做优化。

但是马蜂窝在融资以后追求日活数据,采用了一套不适合自己的运营方式。虽然这期间马蜂窝的日活从80万涨到了200万。但是核心用户在最近3个月从26万降低到18万再到现在10万且 持续降低,基本盘差不多都流失了。

产品的核心价值越来越低,自然失去了竞争力。

前不久,有朋友问了我如何衡量产品粘性,用留存率还是流失率。

这两个指标刚好互补,留存率是仍然在使用的用户比例,流失率是不再使用的用户比例。从数学意义上来说,知道了留存率,也就知道了流失率,两者的和肯定等于100%。

那么在业务上,是不是随便用哪个指标都可以用来衡量用户粘性?

要记住,我们选择了什么指标,就会导向什么业务动作。

留存率更加关心的是,从用户获取的角度综合分析获取用户的渠道方式是否合理,产品用户规模是否能够增长。而流失率则关心为什么有些用户离开APP。

  • 如果我们选择了流失率,那么我们就更倾向于流失用户的召回。可能会选择短信召回,老用户礼包等运营方式降低产品的流失率。这些运营动作一旦奏效,就很容易满足于短期运营行为带来的数据优化,失去对产品价值提升的关注。
  • 如果我们选择了留存率,那么我们就更容易聚焦在更具长期价值的工作上,比如产品的优化。
  • 如果产品是稳定期,产品形态已经非常固定,每一个现有用户的流失都会有较大的损失,那么流失率就是比较好的选择。
  • 如果产品还在用户增长阶段,那么留存率可能是更好的选择。

指标的选择很大程度上取决于业务的需求,一定要找到符合当前业务需求的指标。

好的数据指标是一个比率

为什么比率是一个好的指标呢?

因为比率符合前面说的三点。比率比较容易对比,容易理解,而且比率的可操作性强,是行动的向导。

比如一次促销活动的销售收入是10万,而之前是30万,能说活动很失败吗?不一定,我们必须知道覆盖人群,才能衡量这次活动的效果好坏。

也许这次活动覆盖人群只有上次的十分之一,那么我们用转化率作对比,就可以只用一个指标,就能评估这次活动的好坏。

顺便提一下,《精益数据分析》这本书常读常新,我一直建议数据分析师经常看看这本书。

一些常见的业务指标

最后列举一些常见的业务指标,我以目前最常见的AARRR数据指标体系举例。

AARRR分别代表了五个单词,又分别对应了产品生命周期中的五个阶段:

  • 获取(Acquisition):用户如何发现(并来到)你的产品?
  • 激活(Activation):用户的第一次使用体验如何?
  • 留存(Retention):用户是否还会回到产品(重复使用)?
  • 收入(Revenue):产品怎样(通过用户)赚钱?
  • 传播(Refer):用户是否愿意告诉其他用户?

每个步骤下常见的数据指标有:

1. 获取用户(acquisition)

1)日新登用户数

定义:每日注册并登录APP的用户数。

对于一些APP而言,则是首次启动进入APP的用户。所以对于DNU的定义也可以是:首次登录或启动APP的用户。在移动端统计中,一般按设备来计算。

2)注册用户成本

定义:获取一个注册用户的成本

该指标,对于分析各渠道获取注册用户的成本,制定最优的投放计划。

3)ROI

定义:各渠道投资用户的投资产出比

衡量渠道和用户的性价比,找出优质渠道。

2. 提高活跃度(activation)

1)日活跃用户数(DAU)

定义:每日登录过APP的用户数,一般简称日活。

对于某些APP而言,启动就是一个活跃用户,而另一些则要通过账号注册,形成一个网络账号,才算作一个活跃用户。活跃用户的计算是去重的。一个用户一天来N次也只计算一次。

2)周活跃用户数(WAU)

定义:最近7日(含当日)登录过APP的用户数,一般按照自然周计算。

和日活类似。

3)月活跃用户数(MAU)

定义:最近一个月即30日(含当日)登录过APP的用户数,一般按照自然月计算。

MAU变化幅度较小,产品用户规模稳定性来说,MAU是风向标。但在推广时期,版本更新、运营活动的调整,对于MAU的冲击则更加明显。

此外,产品的生命周期阶段不同,MAU的趋势变化也不同。

4)日均使用时长(DAOT)

定义:每日总计在线时长/日活跃用户数。

关于使用时长,可以分为单次使用时长、日使用时长和周使用时长等指标,通过对这些指标做区间分布和平均计算,了解参与黏性。

5)DAU/MAU

通过DAU/MAU可以看出用户每月访问App的平均天数是多少,这是评估用户粘性的一个比较重要的指标。

DAU/MAU介于3.33%到100%之间,但显然这两种情况现实中基本不可能出现。在不同领域的App会有不同的基准值可参考。

DAU/MAU的值越高,说明App的粘性越强,表示有更多的用户愿意使用App。如果DAU/MAU的值很低,并不能直接说这个App是失败的。

3. 留存(retention)

我们需要可以用于衡量用户粘性和质量的指标,这是一种评判APP初期能否留下用户和活跃用户规模增长的手段,留存率(Retention)是手段之一。

1)N日留存率

定义:用户自登录后,在第N日还有登录的用户比例。

一般常用的N日有次日、三日、七日。其中的登录可以根据实际业务情况更换成注册、使用功能等业务动作。

留存率可以判断渠道的真实性和活跃性。

有时,也要关心流失率的分析。

正如之前提到的,留存率和流失率的关注重点不同,根据业务情况不同,选择重点关注留存率或者流失率。

4. 收入(revenue)

收入是平台运营最核心的指标,他直接影响平台及产品能否良好运营下去。

1)付费率(PR或者PUR)

定义:付费用户数占活跃用户的比例。

通俗地说,付费率也称作付费渗透率,在移动APP市场,多数只关心日付费率——即Daily Payment Ratio。

付费率的高低不代表产品的付费用户增加或减少,付费率在不同APP类型的产品中表现也是不同的。该指标可以评估产品的收益转化能力。

2)活跃付费用户数(APA)

定义:在统计时间区间内,成功付费的用户数。一般按照月计,在国际市场也称作MPU(Monthly Paying Users)。

3)平均每用户收入(ARPU)

定义:在统计时间内,活跃用户产生的平均收入。

公式:ARPU=总收入/用户数

国内的ARPU往往计算的是 总收入/付费用户数,实际上国内说的这个口径严格上是ARPPU。ARPU用于产品定位初期的不同规模下的收入估计,也是LTV的重要参考依据。

4)平均每付费用户收入(ARPPU)

定义:在统计时间内,付费用户产生的平均收入。

公式:ARPPU=总收入/付费用户数,即总收入除以总付费用户数。

部分头部用户会影响平均值,分析时需要看一下用户付费金额的分布,尽量避免头部用户和长尾用户的影响。

5)用户生命周期价值(LTV)

定义:客户终生价值,是公司从用户所有的互动中所得到的全部经济收益的总和。

这个指标决定了获取一个用户我们能接受的最大成本,在获客阶段的成本如果超过LTV是不划算的,当然除非正处在砸钱圈用户的阶段。

5. 传播(refer)

互联网时代,用户自传播变得越来越重要。近几年有许多经典的病毒式营销案例,比如拼多多的微信拼团,就是通过用户自发的行为达到产品推广的目的。

1)传播用户数

定义:有分享传播行为的用户人数

一般是已经使用产品的种子用户,该指标可以衡量产品的被认可程度。

2)传播次数

定义:传播用户传播的次数

3)被邀请注册用户数

定义:传播过程中邀请过的转化成注册用户的人数

4)K因子

定义:(每个用户向他的朋友们发出的邀请的数量) * (接收到邀请的人转化为新用户的转化率)。

K因子也被称为病毒系数,用来衡量推荐的效果,即一个发起推荐的用户可以带来多少新用户。

比如用户向用户发起3次邀请,每次邀请转化的比例是30%,那么最终的结果就是3*0.3=0.9,即一个用户会邀请来0.9个新用户。

5)NPS分值

不是所有场景都像互联网一样可以追踪用户的分享行为,很多传播行为是口口相传,这种无法获得推荐和转化率的情况下,NPS分值是较为常用的评估指标。

NPS是通过发放问卷的方式,然后在问卷中问用户有多大的意愿向身边的朋友推荐这款产品,分支分为0-10分,其中0-6分为不推荐,7-8分为不纳入NPS计算范围,9-10分为推荐者。

NPS=【(推荐用户数—不推荐用户数)/返回分数的用户数】*100

通常认为,30分算不错,50分算很好,70分就算优异了。此前的一些调查显示,苹果公司的NPS分值是77分,特斯拉是97分。

写在最后

指标思维的内容并不复杂,难点在于保持“说事实”的习惯。优秀的数据分析师在日常沟通时,是不能出现诸如“一些、有点、非常”这样的模糊词汇的,而是说出具体的数据。

所以本文只是做一个引导,更重要的还是要时时提醒自己,做到冷静的观察,用指标数据代替情绪化思考。

长期坚持,就能忘掉坚持,成为一种思维习惯。

参考文档:

  • 《数据的本质:无人不是数据分析师》车品觉
  • 《精益数据分析》
  • 《数据化决策》
  • 《不可靠的数字》纯银V
  • 如何看待马蜂窝被曝疑似裁员40%,真实性如何?- 章鱼老师的回答
  • 《5分钟建立超详细的AARRR模型数据指标体系》 公众号:从南迹
  • 《talkingdata:互联网金融运营指标体系蓝皮书》

#专栏作家#

三元方差,公众号:三元方差(sanyuanfangcha),人人都是产品经理专栏作家。专注用数据驱动业务增长,擅长数据分析、用户增长。喜欢阅读、思考和创作。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 不说别的,就文章后面的参考文档,必须点个赞

    来自上海 回复
  2. 写的真好,观点明确,逻辑清晰,表达准确 ; 表达观点,离不开客观事实的支撑,而准确的数据又是对事实最好的表述方式,而数据则依赖统计和展现技术才能形成有价值的信息来形成对事实的支撑,希望再就统计分析做一期讲解,这样就更完美了。

    来自天津 回复
  3. 写的好!怎么衡量X日留存背后代表的数据意义呢

    来自广东 回复