Session 分析的妙用
编辑导语:最近在工作过程中,发现有不少业务同事对于用户行为分析中的 Session 分析非常感兴趣,但是对于这个分析方法的定义和运用场景存在很多误解。于是笔者打算写一篇针对 Session 分析的专题讲解,希望能给各位小伙伴带来思考和收获。
一、定义
Session 翻译过来是“会话”,简单来说就是用户在APP/小程序/官网等平台上进行浏览/点击/滑动等行为聚合成的序列(以下以 APP 为例,所有场景都可以运用到小程序和网页端)。
类比在电商平台购物时的场景,当我们点击并打开客服聊天框时,就进入了和客服的 “会话”,我们会向客服询问产品的情况或投诉,只有我们主动结束和客服的沟通,或在一段时间内我们没有继续向客服发消息时,客服才会发来 “满意度邀请”,此次 “会话” 就结束了。
用户启动 APP 后在 APP 上的一系列操作和互动,也可以看作是用户和 APP 的 “会话”,即使是用户短暂放下手机去做别的事,只要在后面又重新打开 APP 进行操作,此次 “会话” 就没有结束,除非用户离开的时间超过了阈值,“会话” 就会自动结束。
二、Session存在的意义
有的小伙伴可能会问,既然要分析用户的行为序列,为什么不直接对用户从打开到退出 APP 的行为链条整体和链条中的各个事件进行分析,而是要创造出 Session 这个概念呢?下面给出一个例子。
在上图中,这个用户在上班路上打开了 APP,逛了一会后就退出了 APP。在下班回家后打开了 APP,逛了一会后放下手机,用一分钟倒了一杯水,接着回来又打开了 APP 继续浏览,直到最后退出了 APP。
如果简单使用 “打开-退出 APP” 作为行为序列的切割标准,该用户在上班路上使用 APP 的深度比回家后高(可以计算图中从打开 APP 到退出 APP 中出现的 “圆圈” 的个数计算用户从打开到退出过程中与 APP 的互动深度)。
但是实际上并不是如此,用户在第一次退出 APP 后只是起身倒了一杯水,并没有结束与 APP 的互动。如果轻易得出了 “上班时段的使用深度高于回家之后” 的错误结论,将会误导业务同事,严重的话可能会导致其做出错误的决策。反之,Session 可以将回家后的两段貌似 “割裂的” 行为序列进行合并,从而揭开用户在一段时间内所做的行为和背后的动机。
三、Session的“切割”原理
回到刚才的例子,既然不是粗暴地以 “打开 – 退出 APP” 作为用户行为序列的切割标准,那应该以什么标准切割用户在 APP 上的行为链条呢?
这就要引入一个 “切割时间” 的概念。在第一部分的时候笔者提到 ,“除非用户离开 APP 的时间超过了阈值,‘会话’ 就会自动结束”,这个 “阈值” 便是 “切割时间”。
再举个简单的例子,假设我们设定切割时间为 5 分钟,那么就代表着如果用户在做了某个行为 5 分钟后没有任何其他动作,前面的 “会话” 便会被 “切割” 并结束。
另外,在某些情况下,我们也可以设置特定的 “会话” 开始和结束事件,一旦用户做了某个操作就会自动开始/结束 “会话”。
四、Session中可以分析的指标
1.“会话” 的个数
还是回到刚才的例子,在上述场景中,这个用户该天有 2 个会话,代表着这个用户该天在 APP 上有 2 段 “访问” 记录。当然,我们希望 “会话” 的个数越多越好,这个指标越高代表用户对 APP 粘性越高。
2.“会话” 的深度
上图是某个用户的某次 “会话”(假设该 “会话” 中只记录了 APP 的页面浏览以及打开和退出),想要计算 “会话” 的深度,只需要数该行为序列中 “圆圈”(发生的事件)的个数。
上图的会话中 “圆圈” 有 6 个,代表这个 “会话” 的深度是 6。这个指标的使用场景一般是计算用户的每次 “会话” 或人均浏览深度。我们把用户的浏览行为单独挑出来,重新根据时间排序串成新的行为序列,并根据切割规则切割成一个个 “会话”,即可计算每个 “会话” 的深度(用户每次访问的页面浏览数),并进行每次 “会话” 或每个用户的平均数计算。
3.“会话” 的跳出率
上图中,该用户共有 4 次 “会话”,其中有两次 “会话” 只启动了 APP,后续就没有做任何动作,这两个 “会话” 的深度就是 1。
跳出率的计算方法就是拿深度为 1 的 “会话” 个数除以总的 “会话” 个数,由此可得,上图的 “会话” 跳出率便是 2 除以 4 等于二分之一。该指标为负向指标,越高就说明用户对于 APP 不是很感兴趣,启动了之后就不会再做任何后续的操作。
4.“会话” 内部各事件的属性
以上指标都是对 “会话” 本身的分析。实际上,我们还可以对会话中的每个事件进行分析,例如最常见的页面平均浏览时长,就可以通过 “会话” 中每个事件发生的时间进行计算。
五、案例:渠道投放效果分析
在渠道投放过程中,渠道落地页作为用户点击渠道链接后进来的第一个页面,起到了重要的 “第一印象” 的作用,直接决定用户接下来是否会与 APP 交互。
我们平时在分析渠道效果时,会分不同渠道看渠道落地页 PV、UV 等常规指标。但是,前面所说的页面跳出率也可以用于评估渠道效果,即用户看到渠道落地页就 “跳出” 没有做接下来的操作的比例。
假如下图是统计出来的分渠道的落地页 PV、UV 和跳出率数据(全部为模拟数据,仅供讲解使用)。
在上图中,我们发现 xxx 渠道来的 PV、UV 很高,但是跳出率很高。很多从 xxx 渠道进来的用户看到此落地页就直接离开了,可能是因为该渠道带来的用户质量太差,抑或是落地页本身有问题。虽然 yyy 渠道 PV、UV 不如 xxx 渠道,但是跳出率很低,大多数从 yyy 渠道进来的用户都会被落地页吸引并做接下来的操作。
那如何确定到底是渠道本身带来的流量问题,还是落地页设计的问题呢?
我们可以拿自然流量带来的渠道落地页 PV、UV 和跳出率做比较,因为自然流量往往质量较好(愿意通过各种方式主动点进来看的用户肯定是意向度较高的)。
如果连自然流量的跳出率都很高,说明该落地页的设计本身就有问题,如果自然流量的落地页跳出率很低,说明是 xxx 渠道带来的流量质量有问题。
六、小结
以上是笔者基于过往工作经验所总结的方法论,受制于个人经验可能有不完善的地方,欢迎大家批评指正,也欢迎感兴趣的小伙伴与我作进一步交流。
小插曲
我在参加人人都是产品经理2021年度作者评选,希望喜欢我的文章的朋友都能来支持我一下~
点击下方链接进入我的个人参选页面,点击红心即可为我投票。
每人最多可投3票,投票即有机会获得百万惊喜礼品&起点课堂千元豪礼哦!
投票传送门:http://996.pm/7lJpP
作者:Albert,就职于某知名大数据服务公司;专注于数据产品、数据埋点和用户行为数据分析;“数据人创作者联盟”成员。
本文由@一个数据人的自留地 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
专业
讲得很好
nice
很清晰
这是一个我日常不经常接触到的概念,作者讲的还是蛮详细的,受教了。
解释得非常清楚
写的很好!