数据篇|如何成为一个运营大牛(一):运营中的那些数据
数据化运营是目前谈的非常多的一个话题,所谓大数据的价值也在于用数据来驱动决定,避免一些主观的、基于本能的或有认知偏见而导致的错误决策,让所有的决策变的合理且有方向。但其实目前市场上还是有不少的公司并没有真正的运用好数据这一把武器,我们的数据篇将慢慢揭开数据运营背后的奥秘。
在当下的互联网时代,几乎每一个人都知道大数据的强大,每一个企业主都在强调我们要以数据来说话,每一个做运营的同学都知道数据很有用。那么,我们说的运营的中的数据运营,到底是以一个什么样的东西呢?
这也是我们数据篇里首先要提的:数据它不仅仅是那些阿拉伯数字,它的意义在于它背后的那些“因”和“果”。所以它首先是一个逻辑思维。种的什么样的“因”,才能得到什么样的“果”,那我们如何才能知道呢?这个就要依赖于数据了。数据是“果”,而之前的运营工作是“因”,我们要改变“果”,就要改变“因”。
我们先以一个通俗易懂的案例来说一下数据运营的几个步骤:
我们平时都要定期的去体检,体检完成之后我们会拿到一张体检报告(上面有各种指标数据),我们看了数据之后会和标准数据进行对比,对比完成之后我们会发现我们身体上比较健康的部位和差的部位,然后我们会根据我们比较差的身体部位想解决的办法,最后我们通过调理或治愈那些差的部位来获得整个身体的健康。
我们来分析以上步骤:
我们去做体检,就是我们开始做数据运营这件事了。
每个体检套餐上的数据数量是不一样的,我们选择了哪个套餐,就是完成了我们的数据规划的工作。
我们拿到一张体检报告,就是我们完成了我们数据收集的工作。
我们通过对比发现了我们较差的身体部位,并找到了改善的方法,就是完成了我们数据分析的工作。
我们通过实现方法最终把整个身体体质改善,就是完成了一次数据驱动运营。
而那张体检表上所有的数据,就是我们的数据模型。
我们看下图,数据运营的步骤:
这一次的体检,他对我们有什么帮助呢?
- 它直观的告诉了我们目前身体的状况。
- 它告诉了我们哪些点是好的,哪些点是差的?
- 它会引导我们对我们身上的某个器官有更深入的了解。
- 它能帮助我们找到改善的方法。
- 它最终让我们身体变的更健康。
我们把“身体”换成“公司”,数据运营的作用就马上出来了:告诉你运营当前状况、告诉你运营情况的好或坏、让你对用户有更深入的了解、帮助你找到改善效果的方法,最终让公司能够更好的发展。这就是数据运营的作用。
接下来我们进入主题了,我们应该怎么做呢?
我们来看一看体检那个案例,如果把体检作为一次数据运营来看的话,要完成首先有两个必要前提:
- 知道要哪些数据;
- 知道每个数据背后意味着身体的什么状况。
同样,在我们的运营过程中,我们首选也必须知道:
- 我们要收集哪些数据;
- 每个数据背后意味着运营的什么情况。
很多做运营的同学特别是一些新手运营会觉得,数据太多了,感觉什么都有用,但同时又无法下手。其实数据并没有我们想的那么复杂。
在正式说数据之前,我们先来明白两个概念:
- 数据分析是一个极为庞大的学科,在各行各业各领域都会大量的应用,需要统计学、数据库技术、编程技术等。我们这里说的,只是在一家公司业务体系下,针对用户,围绕用户所进行的的一些数据运营工作。
- 数据运营是一个向下无极限的工作,理论上来说,随着数据量的增大和维度的不断拆解,可以无限制的精细化。
举个例子:我们统计了1天的新增用户量。这个是普通的公司会收集的一个数据。但随着数据量的上升,我们可以对此进行维度拆解:
- 比如维度区域:我们拆成省份,再拆变成市,再拆变成区县、再拆变成区域 ……
- 比如维度时间:我们拆成每小时,再拆变成每分钟,再拆变成每秒钟……
- 比如维度人群:我们拆成性别,再拆变成职业,再拆变成年龄……
- 比如维度设备:我们拆成操作系统,再拆变成手机型号……
如果我们拆成以上的维度,我们很有可能得到一条极其精细化的数据,比如:在某天的几点几时,在某市某小区里面,一个25岁的女性,职业是教师,拿着iphone7手机,成为了我们的用户。
只要掌握了我们面向对象的思维,拆维度并不难,我们只需要判断的是:在我们当下的运营工作中,需要拆到哪个维度就可以了。
我们常说的大数据中的“大”,其实就是数据量的“大”+ 维度的“多”。
接下来我们要开始规划我们的数据了,我们的运营工作中到底有多少核心指标呢?
第一步:我们要找到我们最顶层的核心数据指标
所谓最顶层的数据指标,其实就是一个指路的方向,它引导着我们所有的运营工作忘一个方向去前行。也是一家公司的总战略方向,这是必不可少的一点。那我们怎么确定我们最顶层的数据指标呢?我们可以回顾一下我们的《思维篇|如何成为一个运营大牛(二):运营立方体》,我们就知道,抛开产品之外,对绝大部分公司而言,最重要的指标就是:用户量和单客利润,单客利润也称ARPU(Average Revenue Per User,即每用户平均收入)。
大家通过前面的篇章也了解,除了像电商之类的是直接从拉新到转化一步打通,大部分情况我们在转化之前,需要做留存和促活两步的铺垫。所以我们要获取ARPU之前,留存率和活跃度非常重要,所以:留存率和活跃度(一般用日活做标准,简称DAU)这两项指标也是顶层的核心指标。
显然,这是我们最重要的几个数据指标。这样,我们确定了最顶层的四个常用的核心指标:用户量、留存率、活跃度(DAU)、每用户平均收入(ARPU)。其实以上四个指标也是对应了我们拉新、留存、促活、转化四步。
第二步:最顶层的数据指标只能有一个
虽然用户量、留存率、活跃度(DAU)、每用户平均收入(ARPU),这四个指标都是非常的重要,也是在运营的工作中必须需要同时抓的,但是运营的不同阶段,我们也必须在这四个里面选出一个老大来。这个没有一个明确的选择标准,会根据公司的实际情况(行业、模式、背后的资本支持等)进行调整。一般来说初期会以用户量,中期会以留存和活跃度,后期会以每用户平均收入为核心指标,如果一家创业公司进行融资,产品算是A轮的话,那么以上几个指标分别对应的可能就是B轮、C轮和IPO轮。
第三步:我们开始往下拆分我们的指标
我们知道用户量、留存率、活跃度(DAU)、每用户平均收入(ARPU)这四个指标是我们的核心指标了,但如果只是看这四个指标的话,会在很多的情况下有失偏颇,所以围绕着这四个,我们还有一些重要的核心指标。
1、用户量
看过前面文章的同学都知道,我们的用户量是通过渠道来的,而渠道来源于:自有产品渠道、外部免费渠道、外部收费渠道。不管是以上哪种,我们做的都是:让某内容,在某个渠道下的曝光后,让某些用户看到,最后获取到了用户。
那么,在不考虑渠道成本的情况下,如自有渠道和免费渠道,我们都可以分解成以下两个数据指标:UV(独立访问数)、新用户转化率。而新用户转化率=本次新增用户数/ UV(独立访问数)。
在考虑渠道成本的情况下,我们必然又多考虑一个指标:新用户获取成本。
比如:
- 渠道A:投放10000元,带来5000流量,转化成1000个用户,转化率是20%。
- 渠道B:投放2000元,带来3000流量,转化成450个用户,转化率是15%。
以上述的数据来看,虽然渠道B不管在流量、转化率各方面都低于渠道A。我们还是会优先选择渠道B,因为它的新用户获取成本比较低。
当然,不能仅仅以新用户获取成本来判断一个渠道的好坏,我们还要综合考虑这些用户后期的留存和活跃情况,否则就要惨遭羊毛党的毒手了。
这样,我们在这个环节多了三个核心指标:UV(独立访问数)、新用户转化率、新用户获取成本。
2、留存率
留存率比较容易理解,就是指一个新用户在一定时间之后,仍然留下来的比例。由于留存率是一个线性的概念,所以我们一般从时间的维度对他进行分解,我们又多了三个常用的核心指标:日留存率、周留存率、月留存率。一般我们主要看月留存,但日留存和周留存对一些高频使用的产品是非常重要的。
3、活跃度(DAU)
其实“活跃度”这个东西,不同的公司不同的产品,都没有一个明确的界定。特别是一些低频的产品,比如旅游型APP,大部分人会在想旅游的时候才会打开,这种时候就要用一些高频的辅助输出来支持了。参考《结构篇|如何成为一个运营大牛(四):一图览运营》
日活也是一个线性的概念,但它不能单独来看,必须结合日活增长来综合考虑,原因我们举个例子:
某产品第一天的日活为10000,第二天的日活是11000。从表面上看数据不错。
但实际上第一天里面有2000个是当日新增并活跃(DNU),第二天里面也有2000个是当日新增并活跃。所以第一天的日活增长为2000/10000=20%,第二天的日活增长为2000/11000= 18.2%。换句话说,日活确实是在增长,但是增长的加速度减慢了。
大家通过物理知识都知道,加速度是一个非常重要的东西,当加速度开始减小的时候,虽然速度还是在增大,但也是呈衰退趋势了,需要我们警惕。如果有一天日活增长为0的时候,那就说明没有新增活跃用户了。当时Facebook的扎克伯格去见投资人的时候,亮出的所有数据全部低于当时的竞争对手Myspace,唯独一个数据:日活增长。通过这个数据投资人相信了Facebook会在一年内超过Myspace,而事实也确实如此。所以,日活增长也是我们的一个核心数据指标。
这里,我们又多了两个核心数据指标:当日新增并活跃DNU、日活增长(DNU/DAU)
4、每用户平均收入(ARPU)
ARPU是一个有时间的数值,一般以月为单位。一般理解为每一个付费用户的平均月收入,公式为月总收入/月付费用户数。所以ARPU必须和付费用户数联系起来一起看。举个例子:
- 公司A:一个月收入为10000,免费用户990个,付费用户10个,月ARPU值为1000。
- 公司B:一个月收入为50000,免费用户500个,付费用户500个,月ARPU值为100。
从这个例子看,虽然公司A的ARPU值远大于公司B,但肯定没有公司B好,原因就是付费用户转化率没有B高。所以,这里我们又多了一个核心指标:付费用户转化率。
另外,我们知道一个概念,就是:每一个产品是有生命周期的,有些长,有些短。举例:
- 产品A:它的生命周期为三个月,它的ARPU为1000元/月。
- 产品B:它的生命周期为1年,它的ARPU为800元/月。
那么很显然,产品B比产品A更有吸引力,所以我们需要再引进一个指标,用户生命周期价值(LTV)。即为用户在整个产品的生命周期中,贡献的价值,如上例:A为3000元,B为9600元。
但凡说到收益的东西,我们就必然要想到成本,大家还记得我们运营结构中的那个盒子么,有入口和出口,所以,投资回报率ROI也是我们必须要抓的一个核心指标。
好了,到这一步为止,我们已经把整个运营中最重要的这些核心指标列了出来。当然,我们还可以继续:
第四步:根据实际的需要再继续往下拆分
前三步的几个数据指标几乎是任何公司必需的核心指标,从这一步开始,基本就没有什么标准了,不同的行业不同的公司不同的阶段,都可以不断的往下无限制的细化。比如:
新用户需要注册的,我们可以分为:引导页转化率、注册页转化率、完成页转化率等。
渠道可以根据渠道的类型(CPM、CPC、CPA),我们可以再拆分为:到达率、点击率等。
流失这块可以分为:付费前流失率、付费后流失率等。
活跃这块我们可以根据设定的活跃标准分为:轻度活跃率、中度活跃率、重度活跃率等。
成交这块我们可以分为:收藏转化率、订单转化率、成交转化率等。
我们还可以根据时间维度、区域维度、设备维度、用户维度等等各种维度在上面的基础上不断细化。
科技的进步从某个程度上来说也意味着数据的不断精细化吧,或许这就是人工智能的未来吧。
好了,至此,我们把我们要的一些核心数据指标全部列出来了,如下图:
我们之所以要把以上数据指标单独每个解释一遍而不解释其他数据,是因为以上指标直接关系着一家公司的生死存亡,是我们运营体系中最重要的核心指标。在我们的运营体系中,这些指标都属于三维空间的指标,而其他的都属于二维空间或一维空间的指标。至于运营指标的四维空间,我们会在下一篇中结合分析方法进行描述,敬请关注。
接下来,我们用一道小题目来思考一下:
题目: 我们现在在运营一款产品,它的运营数据如下:
产品的新用户日、周、月留存分别是80%、40%、20%,此后稳定在20%
我们把留存中的前20%设定为活跃用户
我们产品中有一款付费产品,每次交易可带来10元的利润
这款产品的生命周期为1年
所有活跃用户平均每2天登录一次,每3次会产生1次交易
所有非活跃用户平均每6天登录一次,每5次会产生1次交易
在产品第三个月初的时候,我们准备了一次软文投放,按惯例这篇软文的注册转化率在5%,此次投放金额10万元。
问题:
- 本次软文的阅读量达到多少的时候,基本可以确保收回投资?
- 假设此时有另外一家渠道报价CPC单价为1元/次,那么我们在该渠道上的预计ROI是多少呢?
(注:如果您的计算时间超过5分钟,那么应该就是方法不对了。)
大家可以稍微思考一下,我们将在本文结束的时候公布答案。
我们先继续本篇的内容,刚上面的这张图可以算是我们的运营的数据体系了吗?
不,还不是。纵使我们把很多的维度都细化了,也只是算是一个数据模型,还达不到数据体系的要求。因为以上的数据是加工过的数据,是表现层的。
什么意思呢?我们来看上面的那些数据,什么转化率、留存率、活跃率啊等等,这些其实是我们主观要的数据,而非直接可以拿到的数据。也就是说,我们要的是一个加工过的数据,而我们要拿到这些数据,我们必须要有接入层的原始数据。
我们来举个例子:
我们做了一次活动,有成两个页面,分别是引导页、注册页,在A渠道上进行投放。我们现在想知道本次活动在A渠道上的新用户转化率。
我们要的这个新用户转化率是一个加工后的数据,在原始数据里是不会直接告诉我们这个数据的。所以我们必须要根据这个加工后的数据,来设计它的原始数据。如下图:
我们根据这个表,我们可以知道,A渠道上来了4个人,通过他们的行为记录,我们可以知道,最后完成注册的有1位,新用户转化率是25%。这里,用户来源、用户、行为、时间是原始数据,最后新用户转化率是加工后的数据。
原始数据一般通过以下几个方面去获取:
(1)通过用户的属性和行为来设定
比如用户的年龄、性别等以及用户做了哪些行为操作等。
(2)通过产品的功能细分来设定
这个主要针对的是APP等一些互联网产品,整个产品流程中每一个细分功能的数据,比如:收藏、评论、领优惠券等等也是我们的原始数据。
(3)通过外部数据的调用
一般就是调用外部产品的API接口,比如调用了微信的接口,我们就获取了我们微信上面的各种数据。土一点的办法也可以通过报表的导出和导入来实现。
我们要搭建我们最终的数据体系,需要首选确定我们的加工数据,然后再根据这些加工数据,来搭建其背后的原始数据。这样,才算真正完成了数据规划。
最后我们来看这么一张图:
我们通过收集接入层的原始数据,进行加工,产出加工的数据,进行展现,再通过分析的手段进行分析,找出问题并形成有效的运营解决策略,再进行实施,最后产生新一轮的原始数据。这就是数据驱动的一个闭环。
好了,到这里我们才算真正的把数据运营前期的数据规划工作全部做完。但值得一提的是,数据的规划不是一步到位的,事实上也很难一步到位。我们应尽早尽可能的把数据体系搭的完善一点,并在运营的过程中不断的完善和优化。希望本篇也能帮助您完成你自己的数据规划。
最后,我们就用上面的小题目的解题来完成此篇文章吧:
- 先辨别出此处的日留存、周留存是个坑。
- 算出LTV:
- 假设有100个新用户,那么会产生20个留存用户,其中4个为活跃,16个为非活跃.
- 活跃用户的平均产出是1笔交易/6天,即5笔交易/月=50元/月,由于产品生命周期还有10个月,所以产出500元/人,4个人即2000元。
- 非活跃用户的平均产出是1笔交易/30天,即1笔交易/月=10元/月,由于产品生命周期还有10个月,所以产出100元/人,16个人即1600元。
- 总计3600元,除100,得LTV=36元/人
总投入为10万元,即需要本次获取新用户=100000/36 ≈ 2778(人)
根据5%的转化率,把2778/0.05=55560(阅读量)
(1)即至少确保有效阅读量达到55560,才能保证这次10万元的投资在10个月后可以收回成本。
(2)CPC单价为1元/次,根据我们的转化率,我们的新用户获取成本为20元/人,结合我们上述的LTV36元/人,我们的投资回报率在ROI=36-20/20=80%。
小结
数据是数据运营的关键和前提,最好数据规划也是数据运营首选要做的一步。当然,我们得到了我们的数据,如何可以有效的展现并合理使用最终产生效果呢,这就要说说数据使用的场景了和数据分析的方法了,请关注下一篇:如何成为一个运营大牛——数据篇(二):数据使用的三测。
作者:致远,连续创业者,曾为多家上市公司提供过运营整案服务,曾任 Mr&Mrs连锁健身互联网中心总经理,现任 Muma 儿童艺术联合创始人兼运营顾问,肤智COO 兼联合创始人。
本文由 @致远 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自 unsplash,基于 CC0 协议
题目有问题吧,如果考虑的是注册转化率,那么对应的应该是新用户,而新用户的生命周期还是应该按照1年起算才对而不是10个月。按照我的理解生命周期不是产品属性是用户属性
可能我把事情想复杂了。
作者题目中所需要产生的阅读量都是第三个月第一天当天产生,且用户在第二天立刻进入活跃与不活跃的状态分类。实际情况应该会复杂一些,但是作为目标参考反推,应该也能应用在工作上。
当年数学学得不好,理解能力真差。希望作者有空看到可以再提点一下
看完这篇我真的不会做这道题TAT
面壁去了。
我非常喜欢你的文章
老师你怎么不更新了
老师,想请教下,2B的运营怎么进行数据规划呢?
一直跟过来,收获很多!
请问老师,题目中是假设了用户生命周期一年么?
说错了,是产品生命周期一年么?
您定义的留存率与我熟悉的30日留存率为新增/活跃用户第30日后产生登陆行为的比例 不太一样,只能理解为一个月内有20%的用户产生了登陆行为。您前面说留存是不需要成本的而离开是需要成本的,那么留存需要在某一段时间内活跃,是不是可以理解为这也是需要成本的。
您好,我对您“日活增长开始减小的时候虽然速度还是在增大但也是呈衰退趋势了”的关键有一些疑惑。按我熟悉的概念当日新增的用户一定是活跃用户,那么日活增长其实就是新增用户在活跃用户中的比例,如果新增在加大,留存率减小,日活不变,其实日活增长也是在增加的,所以这个指标必须要结合一些其他的指标来看,这么看起来日活增长更适合作为参考指标而不是核心指标。
老师好,文章主要介绍的几种数据,似乎都是比较偏结果的数据。在日常工作汇报中会比较常出现。
但在工作中,似乎还有许多数据是运营经常需要自己注意到的,比如用户的互联网行为、业务行为等。请教老师,这些数据之间的关系,我们应该怎么去协调呢,或者说应该怎么理解呢。谢谢
我刚到一家新公司,APP开发还没有好久,运营部就我一个人,而且客户群体是建筑工人,现在我基本上是做一些没有技术的活,干一些杂货,前辈,有什么好的建议吗?谢谢
运营小白,看完大脑一片混乱 😥
😈 一样啊,题看的很懵
下面那个题目,为什么不考虑用户在接下来10个月还会继续有流失呢?
最后的答案是假定了用户接下来10个月一定不流失哦。
有两个概念有点混乱了:
第一个是ARPU,这个不应该是月均总收入/月用户数吗,为什么会是月均总收入/付费用户数呢?
第二个是LTV,这个是用户生命周期价值的话,在题目中用3600/100有点不理解,按照之前的解释,3600就是LTV了,为啥再除以一个用户数。其实3600/100算出来就是ARPU了,也就是说你在这里实际是除以了所有用户数,而不是付费用户数,跟第一点的疑问相同。
还请解答~~~
您好,谢谢关注,还看的那么仔细:),确实,ARPU值在早的时候是以月均总收入/月用户数这个公式来算的。但随着后来各种商业模式的突起,存在着大量免费用户+少量收费用户的情况,在这种情况下,如果按总用户算,很多公司的数据会非常难看比较吃亏。所以很多公司会以月均总收入/月付费用户数作为一种计算ARPU的方式。也有分的讲究的把全部用户叫ARPU,付费用户叫ARPPU。
第二个,由于结合渠道那块,需要考虑到所有用户,所以算出的是所有用户在产品生命周期内的平均产出。
ARPU:每用户平均收入;ARPPU:每付费用户平均收入。 按照统计粒度不同,可以分为日ARPU/ARPPU,周ARPU/ARPPU,月ARPU/ARPPU
LTV:生命周期价值。按照时间粒度,可以分为LTV7,LTV14,LTV30…..(就是7日总价值,14日总价值,30日总价值…) 按照主体不同分为单个用户的LTV和产品的LTV。一般情况下都要说明主体是谁?生命周期是日月年还是总。 题主说的LTV,应该指的是单个用户的终生LTV吧
是的,关于ARPU/ARPPU这个问题,运营小白说的是对的,字面解释严格的说这里应该是ARPPU。不过现实中ARPU以付费用户来算的公司不在少数,有一个说法:“付费的用户才是用户,免费的用户只是产品的一部分” :),这里的LTV就是指终生的,没写的细,疏忽了
您好,请问第一小题“活跃用户的平均产出是1笔交易/6天,即5笔交易/月=50元/月,由于产品生命周期还有10个月,所以产出500元/人,4个人即2000元。”里的产品生命周期为什么不是12个月? 根据题目是已知产品生命周期为1年 我算出来是50*12 即活跃产出为600元/人。此处还请解答下,谢谢!
举的例子上是在产品推出第三个月初的时候开始的:)
你这个例子举得不恰当呀。 需要解决的问题是你的日留存,周留存,月留存是如何定义的。 当第3月开始推广,那么3月的新增用户,当月(3月)的留存率是20% 还是100%
20%呀
如果是20%的话,就是你这么算的。 因为我是游戏行业,很多定义和你的例子有些差异。比如当月新增用户在当月的留存率是100%,当日新增用户在当日的留存率是100%。建立的数学模型为粒度到日,活跃用户以新增用户的1,2,3,4,5,6,7,8,9,10…….1000日留存率来累积。
恩,游戏行业里玩数据的都是高手,哈哈
为什么第二道题中新用户获取成本为20元/人呢?是投入成本/阅读量,即10万/55560吗?把这个例子中的阅读量理解成人流量的话,这样跟前面的AB渠道例子计算又不同,前面的例子渠道A:投放10000元,带来5000流量,转化成1000个用户,转化率是20%;渠道B:投放2000元,带来3000流量,转化成450个用户,转化率是15%;结论是会优先选择渠道B,因为它的新用户获取成本比较低,这个的算法是投入成本/转化的新用户数(即A:10000/1000=10;B:2000/450)吧?而不是投入成本/人流量了。此处还请解答一下。
您好,谢谢关注,还看的那么仔细:),因为第二题已知CPC为1元/次,即点击一次1元,同时已经注册转化率为5%,即平均20次点击产生一个用户,所以得新用户获取成本为20元/人。
我也仔细看了1下, 你的ROI怎么定义的,ROI是投入产出比,算法是ROI=周期收入/周期成本=LTV/CPX,ROI≤1,这个生意就没做头了。 目前单个用户生命周期价值是36元,单个用户成本是20元,明明有得赚,怎么ROI<1了呢。
:),大部分情况下投资回报率还是会以[(收入-成本)/投入]*100% 的这个算法来算的,比如我们买个基金,官方会宣传年投资回报率是8%而不会是108% 这样,不过这个也不重要,大家知道这个意思就可以了
嗯,投入产出比和投资回报率的区别。