在“2013中国技术商业论坛暨领袖峰会”无数据不互联专场,腾讯云数据分析中心总监傅志华讲述了,腾讯如何利用用户生命周期管理办法帮助产品经理做精细化运营。
【用数据管理你的“用户生命周期”】
腾讯的精细化运营是如何贯穿于整个产品过程中的?
腾讯用到一个很重要的方法,即用户生命周期管理办法。这也是社交网络事业群正在力推的一个很重要的方法论。
什么叫用户生命周期管理?传统营销学讲的是客户生命周期管理,因为腾讯社交群主要客户就是用户,所以我们叫用户生命周期管理。但是传统的对应的理论是客户生命周期管理,简称CLM。《王永庆传》提到一个一个米店老板怎么做生意,他每天会收集顾客用米的情况,包括家里有多少成员,然后能估计到他每天吃多少米,然后推算出这个家庭什么时候能把米吃完。比如买10公斤大米,估计是半个月,到快吃完时,他就会主动送货上门,或者主动打电话。他用这种办法赢得了客户。很快他的经营网络就超过了其他店。
再比如一个游戏数据图表,横轴是游戏用户使用时长,纵轴是活跃用户量。第20轴到25轴用户分两波,有60%的用户活跃用户量下滑得比较明显,还有一波用户是相对保持。所以,就是说用户在使用一个产品时是有一个新鲜感期,过了这一段时间以后,他感觉就会下降,甚至会流失。比如像这款游戏,在第20轴到25轴的流失风险非常高,60%处于高流失风险的状态。再看很多网页应用或者一些手机APP,它的拐点会更早出现,使用这个业务一到两个月就可能会处于高流失风险的状态。我们通过数据怎么快速定位?如何预计这些用户的流失以及帮到产品经理理解它为什么会流失?建议他在产品运营时要策划什么样的活动?
这是一个完整的生命周期管理图,整个周期里面可以分为几个大的阶段,一个是萌芽期、成长期、衰退期等。我今天主要聚焦在两个阶段,也是腾讯认为最容易出效果的。因为我们工作都有KPI,我们的KPI是通过数据能够帮产品经理带来收入,或者带来活跃用户量。
上述游戏案例其实是一个真实的应用。这个应用在横轴是加入应用的时间,纵轴是人均操作次数,即用户活跃度。从这个线能看到,这些用户在购买这个业务前肯定有很多免费的操作才能刺激他购买这个应用。他打算购买前,活跃度突然变得比较高,他购买后,活跃度开始迅猛地增加。
有很多产品的价值传递不一定非常到位,所以我们往往看到很多产品在第一个月和第二个月的流失率非常高。因为作为一个新用户,如果你的新手教程做得不是很好,或者你的产品不是简单易用,你认为你有很多的价值点用户没有感受到,可能就会流失,而且这个比例非常高。所以,我们会聚焦在帮产品经理去研究说什么样特征的用户在这期间会流失得很快,然后我们把它定位出来。定位出来以后,我们要知道它是由于什么样原因想离开这个应用,或者想离开这个游戏,做快速预警。
【如何利用大数据分析进行精准定位】
另外一个阶段是拉新阶段,比如有的产品经理想快速发展新用户,我们用什么样的数据支撑让它更精准定位到用户?
目前,我们将新应用的用户高流失预防暂分两个阶段。
我们有很多历史数据可以学习,即什么特征用户有可能成为新用户。这个数据以及它的各种可能性的特征我们都可以采集到。然后我们再用机械学习的办法——主要用“决策树”的办法研究什么特征的用户能够成为新用户。比如买房用户,如果小孩有四五岁时他还没有房,而且又有一定的经济能力,他是不是拥有很强的买房需求?这里有很多特征和他购买的驱动力非常相关。
我们通过500多个字段预测用户下一阶段的转化率。“决策树”是得到一个知识树的结构,我们找了比较重要转化率较高的几个树枝去做运营,比如将潜在用户划分成七类用户,每类用户的转化率、它转化概率跟普通用户的转化率的倍数都知道。知道这个特征以后,就可以定位这个用户,然后把这个用户对应的ID给到产品经理,比如这里面有三群很重要的用户,转化概率又比较高,而且我们知道他喜欢什么?
因为“决策树”能识别出他的特征出来。这可以建议你对这些用户,比如他喜欢玩虚拟空间装扮,你的业务又刚好对应这个,你就可以策划一些活动,拉动他冲动性消费,他就更容易购买这个业务。
刚才我说到500多个变量,500多个字段里面,最后有用的可能也就10来个。有用的10来个里面,很重要的发现是斜率型的变量,或者增长型的变量很重要。
这个是什么概念呢?比如我要买车,我可能在买车前一个月突然会对汽车类的网站,或者汽车类论坛的浏览量可能比前几个月流量要多得多,这很正常。流量的突增其实意味着我有更明显的购买意向。因此,我们在设计变量时,除了常规型、状态型统计变量和简单的统计量,还要考虑设计一些增长型变量。增长型变量其实在预测用户在转化过程中更有效。
这是我们在拉新阶段用到的一个方法,又是防流失的一个办法,还是用特征识别的办法识别有哪些特征的用户流失的可能性高的一个办法。
比如这里面是一个决策树的案例,用户在使用背景音乐盒每周的操作次数少于1.5次的时候,他的流失可能性达到30%。另外,如果说他每周使用都不到1次,它的流失可能性将更高,达到65%。所以,它是有一个规则,简单写一个SQL就能把这个用户找出来。假设这个条件,同时满足这个条件的用户能筛选出来,而且我们知道流失的原因。是因为音乐盒的操作次数变少还是别的什么原因。然后,我们有针对性地在这方面做活动或者做一些文章,让他更多地体验这个业务的一些价值点。处于高流失风险状态下的他很可能就会流回来。
另外一个是我们每周都会给对应的用户ID打分,它这周28分,下一周39分。哪一些用户会接触它呢?一是流失分数超过10%,即第二周比第一周的流失风险要高于10%,第二种是绝对值大于40%的流失风险,这两个用户我们都要把他定位出来,完后要做相应的产品改进,或者对他们做一些促销,或者一些产品运营活动。从决策树上,我们可以看到哪些方面是用户的主要诱因。这是我们产品的一个效果。我们做特征识别以后,点击率比产品经理平常拍脑袋做的点击率都有不同程度地提升,比如75%,88%等,甚至有的达到翻倍地提升。
做完这还不够,比如音乐盒的操作小于1.5次,每周大盘的使用情况不到一次,这些规则可以通过数据挖掘算出。
另外,我们定位的每一波人群固化下来,刚才我们看到七类用户,其中三类用户是比较重要的,我们就可以把他固化下来,只要他满足这个特征就可以把他归类到这类用户里面,产品经理也对他们做了有效的活动,把这个有效的活动规划下来。如果用户来到这个应用,他满足这个条件,我们后面就可以自动化推荐这个活动。这样,产品经理就不用苦于说我经常要分析我的用户流失情况是怎么样,我的用户流失怎么定位等,这样就节省很多烦琐的非常专业性的事情,它就可以去更聚焦在他的产品创意上,数据挖掘就更聚焦在准确度上。
上述方法论其实也固化在我们给到开发者的一个工具上面,叫腾讯分析和移动分析。在这两个工具上我们做了数据的储备,包括4000多台数据的集群,包括每天新增100TB的统计数据。我们在用户里面已经可以达到10秒的延迟,在外部给开发商可以更高,而这这是开放的一个里程碑。
源:36dsj
500多个字段来预测,我的天啊。。。
他说的应该是用户的属性标签500多个
我就是来入门的~