带你认识留存率:纠正你对留存的所有错误认识
编辑导语:留存率是衡量一个产品对用户是否有价值的最重要的指标,因此也成为产品运营们最为关注的话题之一。本文作者结合自身工作经验,总结分享了关于留存率相关的四个要点,希望对大家有所帮助。
01 究竟什么才是留存率
其实产品领域的很多指标,都缺少业界通用的定义。
并不是没有优秀的定义,只是还没有在业界普及开来。
就拿最简单的产品转化率来说,有多少人能分清用户转化率和用户数比值的差异呢?
再比如复购率,A 产品的复购率是 60%,B 产品的复购率只有 40%,并不一定是 A 比 B 好,很可能是 A 在复购率口径的定义上取巧,让复购率显得好看一点,方便拉投资。
从这一点来看,可以说我们现在所处的时间段,还是一个方法论初生的时间段。
那么,当我们说到留存率时,到底什么才是留存率?
有人说:今天来了,第2天还来,就是留存;第7天还来,就是7日留存。
这种说法还算符合常见的数据平台的定义,不过还不够精准。
有人说:今天来了,7天之内又来过,就是7日留存。
别笑,真的有某明星独角兽高管要求这么定义 n 日留存,并且还说服了 CTO,要照此开发相应的报表每日跟踪。当时亲临其中的我,只好委曲求全,整出来两个概念,一个叫第 n 日留存,一个叫 n 日内留存。
抱着强势批判性思维,我们先去看背后的业务目的,有没有合理性:
想看 n 日内的“留存”,代表着想要看这么一种业务表现:T 日来的人,有多少在之后的 T+1 到 T+n 日还来,这部分还来的人,才能算我留存下来的用户。而觉得不应该看第n日留存的原因,是觉得只看某一日来没来,过于随机了,要是用户 n+1 日或者 n-1 日来怎么办,不都没统计进去吗?
仔细品一品,问题有两点:
- 看 n 日内留存的目的是为了看流失,即有多少人来过一次之后就不来了,然后通过流失反过来得出他想要的留存。出发点是合理的,但是方法确实不当。随着 n 的增加,n 日内留存下来的人会越来越多,换句话说随着时间的流逝,留存下来的人越来越多,这显然是反直觉的。
- 不看第n日留存的原因是没有认识到留存率代表的是群体特征,而非个体特征。如果一张彩票的中奖率是 10%,有 100 万人买,那么我中奖还是不中奖,都改变不了最终有 10 万人会中奖的事实。同样的,对群体而言,单一个体是 n+1 日来还是 n-1 日来没有区别,在统计特征上影响不了群体中有多少人第 n 日回来。而拿单个用户谈留存率是没有意义的,你总不能说因为你中奖了,所以中奖率就是 100%,因为中奖率在讲的是买彩票的一大群人而不是你一个人——指标不适用。
定义留存率的目的,是想要衡量我们从各个渠道那里所获得的流量,最终有多少留下来成为我们的忠实用户。从这个业务背景出发,真正的留存率,一定是针对新用户而言的。对着老用户谈“留存”,实际是在谈另外的业务,比如:
- 新用户留存下来成为老用户之后,有多少能继续留下来,这个业务应该叫用户流失,而不是留存
- 新用户留存下来成为老用户之后,某天来过之后多少第二天还来,这个业务应该叫用户回访或者访问频次,而访问频次又是跟产品形态强相关的,微信每天不只使用一次,而经期管理类 App 一个月使用七八次就不错了
而对于每日所有活跃用户的”次日留存”,就更没有意义了。
这个虚假的数据指标完全被用户的构成所左右:一部分是当日的新用户次留,另一部分是当日的老用户的次日回访 (访问频次) 。
当每日活跃用户 90% 以上是新用户的时候,这个”次日留存”就会很低,而 90% 以上是新用户的时候,这个”次日留存”就跟产品形态强相关,也就是忠实用户的平均使用频次。
所以科学的留存率(日)定义,应该是:T 日新增用户中,在第 n 日(即 T+n 日)再次活跃的用户,占 T 日新增用户的比例。
谷歌的官方说法更简洁,叫:Percentage of new users who return each day。
02 留存率应该怎么看
通过上面的定义,我们再去看日留存曲线的时候,一定是一条这样的曲线:
通过这条曲线,我们可以清楚的知道每一天新增的这批用户,随着时间的流逝最终留存下来了多少。并且这条留存曲线一定是可以通过乘幂函数拟合的,把第 n 日的留存率记为 Ret(n),则一定有:Ret(n)=a*n^b
这里说了这么多“一定”,其实是想强调留存曲线几乎是一条标准的客观规律,无论什么样的产品形态,都有这么一条曲线。他们可能有高有低、有急有缓,但是都可以用一条乘幂函数表示。
而理解了留存曲线是客观规律这一事实,就能理解为什么我们可以用次日留存、7 日留存等作为产品的重要指标了——因为他们都是对留存曲线一整条曲线的点估计。
说白了,就是把一整条曲线降维成一个点,这样我们就可以每天观察这个点的变化情况,从而得知产品的留存状况是变好了还是变坏了。
下图中是次日留存和 7 日留存的变化曲线,X 轴是日期,Y 轴是留存率,业务含义即在 X 日新增的用户,其对应的 n 日留存率是 Y。
很明显,如果没有这种降维方法的话,我们就要给每一天画一条留存曲线了,几十条留存曲线摆在一起是看不出来留存随日期的趋势变化的。
当然,有降维就一定有信息损失。所以我们还是要注意多角度的观测留存曲线才行。
留存曲线有两个重要特征:
- 前期快速下降
- 一定时间后进入平稳期
如果我们想要提高产品的留存表现,就要从这两个方面出发,缩短用户群组进入平稳期的时间 (尽快激活) ,并且让更多的用户进入平稳期 (激活更多) 。
03 次日留存的意义
总有这样一种观点,认为自己的商业模式是很低频的模式,用户往往要几个月才会消费一次,比如酒店、旅游,所以次日留存没有意义,也不需要提高次留。
我想从几方面多角度地全方位批评一下:
- 你以为用户次日不来,次月就会来了?Naive,第二天都没有用户想起你来,一个月之后用户早就把你忘光了,都去隔壁消费了
- 用户的转化是一个过程而不是一个点,一定是从认知、认可再到认购的过程,次留代表的就是认可。只有用户认可你了,才会有后续的认购。
- 越低频的产品,用户的决策链路越长,往往花几个月的时间货比三家,最后决定性的几分钟完成交易链路上的转化。想想如果在这几个月的时间内用户从来都没有访问过你的产品,会是多可怕的事情。所以对低频产品来说,次留同样重要。
并且由于留存曲线是一条统计意义上的曲线,次留是 15% 并不代表只有 20% 的留下来,可能拉长到一个月时间后,总共有 40% 的用户留下来。
然而通过把次留从 15% 做到 20%,你是可以预知到一个月后留存下来的用户有可能超过 50% 的。
这也是这个数据指标的重要价值:通过量化的方式衡量业务表现的变化,并且尽可能的更早发现变化。
注意:重点是衡量业务变化,而不是衡量业务,如果没看懂,建议仔细品一品。
另外衍生一点:次留可以不拘泥于 App,小程序这些具体形态上,从更高的层面上,应该聚焦到产品价值本身的留存上。
如果能通过搜索引擎,社交媒体等,持续的让用户体验到你的产品的核心价值,就能做到用户留存了。
通过 RSS 订阅的方式订阅和持续阅读人人都是产品经理的文章,即使不访问人人都是产品经理 App,这个用户也是人人都是产品经理的留存用户,也会产生实际价值,比如购买人人都是产品经理的周边。
04 从平台留存到细分功能留存
上面我们谈到留存率时,都是面向整个产品或者说整个平台的,比如电商 App 平台的新增用户有多少留存下来。而当平台所提供的产品价值不止一种时,就会衍生出多种多样的细分功能留存。
拿美团来讲,巨无霸美团提供了哪些不同的产品价值呢:
- 叫外卖
- 订酒店
- 订机票
- 打车
- 共享单车
- 买菜
- 买药
- ……
作为一个超级 App,融合了多种服务,提供了多样的产品价值。对于每种服务,可以看到美团都有做新用户的营销活动,比如没用过买菜服务的用户,进入买菜频道的时候还是能享受到新用户优惠。
相应地,只要存在”新用户”的概念,就存在于新用户对应的留存概念: 买菜服务的新增用户中,有多少会留存下来持续使用买菜服务。
甚至就算不是超级 App,也可以细分出更精细的留存。
拿普通电商来说,可以细分到品类的留存,频道的留存:
- 女装品类,每天浏览女装品类的新增用户中有多少留存下来持续浏览女装
- 秒杀频道,每天秒杀频道的新增用户中有多少留存下来持续使用秒杀频道
- ……
当用户在多个不同的服务中留存时,代表着用户对产品价值的认可,相应的,整个平台对用户产生的总的产品价值就更大了,也就意味着平台的留存会随着细分功能的留存提高而提高。
05 结语
相信大家看到这里已经对留存的基础概念有了相对全面的了解。通过制定正确的留存指标,我们才能更好的发现产品的问题。否则很有可能做了一堆事情,不小心影响了产品黏性,结果还看到“留存率”变高了——新用户流失,老用户占比越来越多,大盘留存反而会变好。
作者:Genius,微信公众号:产品研究笔记
本文由 @Guibin 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
想问一下文中“次留是 15% 并不代表只有 20% 的留下来,可能拉长到一个月时间后,总共有 40% 的用户留下来。”这个观点中留存下来的用户百分比是怎么计算的
大受震撼,回答了我一直以来的困惑
请教一下,对于B端的分销产品用户,比如淘宝客这种。第N天留存也同样能衡量业务变化吗?
我们以用户分销成单为活跃标准,第二天用户没有分销成单,第29天用户分销了2个订单,第30天没有分销成单,第90天分销成单2个..
可能会出现,次留10%, 第7日20%,第30日50%, 那留存曲线就不是前期快速下降,一定时间后进入平稳期这个特征了,这样的指标还有意义吗?
你的说法存在2个问题:
1、留存指的是用户留存,并不会因为订单多寡而变化
2、留存率是对群体而言的,讨论单个用户的留存率指标没有意义
我也就这个问题提出疑问:
1. @Jasmine 的意思应该是用户在统计留存率当天用户并没有活跃,反而在统计日前后活跃了,他说的订单数只是举例,不必在乎数字多少,所以还是存在留存率不明确的问题
2. 你说的对群体而言,是基于用户基数足够大的C端产品,B端产品用户基数本来就少,这时候就不能说不讨论个体了
写的好
很有收获,感谢大神分享
很有帮助!
不错。
写的很细致,很好!