数据分析在产品工作中的应用
数据分析作为各种业务找到问题的核心,需要定位问题,找出解决的方案。本文结合具体案例,总结数据分析在产品中的应用以及相关方法论,希望对你有所帮助。
一、什么是数据分析
数据分析的核心是是利用数据发现问题,定位原因,找到解决方案或提出建议的思维,所以分析工具并不是最重要的,也不需要一开始就学Python、爬虫等;对非专业人士来说,其实用Excel就能够满足大部分日常诉求。
数据分析3要素:数据、统计/分析方法、结论。
1)没有准确、丰富的数据,无法进行分析;
2)没有恰当的方法、工具,很难对数据进行加工、找到其中的规律;
3)没有形成结论,则相当于没有结果,半途而废,数据价值大打折扣;
二、数据分析应用案例
举一个数据分析在产品工作中“发现问题-设定假设原因-验证原因-解决问题”的例子;
【分析过程】
第一步:拆解指标
净利润额=总销售额-总退费额-总成本
总退费额=退费客户数平均退费金额=(总购买客户数退费率)* 平均退费金额
通过拆解,可以发现总购买客户数、退费率、平均退费金额都是影响总退费额的因素,为了进一步明确原因,需要辅助数据分析手段。
第二步:发现问题——如何发现问题?
拉取最近一年的退费明细订单数据,汇总加工处理后,发现问题:【缴纳定金后退费】金额占总退费金额比例不到5%,而【缴清全款后退费】占比高达95%。
明显后者退费占比异常偏高,所以我选择继续下钻分析【缴清全款后退费】的数据,并尝试罗列出明显规律:
1)学生完课率越高,退费率越低;完课率与退费率呈现负相关;
2)未上课退费、已上课退费分别占比 70%、30%比例;
3)已上课退费中,按已上课次-平均退费金额进行分布统计,发现两者呈现负相关,已上课次越多,退费订单数越少,且退费金额越少。
第三步:明确核心问题——什么是最核心的问题?
从第二步来看,未上课退费、已上课退费均有可优化的空间,并且一些维度之间存在正向或负向的影响关系,为了让逻辑看起来更清晰,我尝试建立各个维度之间的关系(相关关系or因果关系?),来帮助决策明确核心问题。
蓝色为已知数据维度,绿色为引入的数据维度。
【学生满意度和兴趣度】虽然是源头,但此指标难以量化、没有统一固定标准、数据不方便实时收集,所以不符合指标的要求;而【上课次数】与退费虽然是负相关关系,单并不具备因果关系,用上课次数来衡量退费也明显是不合适的;相比之下,【退费率】是一个好的指标,把【退费率】作为第一关键指标(OMTM原则);又因为【未上课退费占比明显异常偏高】,所以把“降低未上课退费率(目前占比70%,正常约30%)”作为核心要解决的问题。
第四步:探究核心问题的原因——哪些因素有可能造成此原因?
明确问题后,需要从结构化的角度拆分可能会造成问题的原因。从用户、竞品、产品或服务3个层面,以及结合了产品A的付款-上课业务流程,绘制图如下:
这一步是以教育行业为例,其它行业可以根据自己的业务场景来穷举,重点是要全面,指标之间尽量独立。
可能看到这头都大了,这么多的原因,哪个因素是核心原因?为了找到核心原因,我把每个因素进行“假设—验证—结论”,分析结果如下图(灰色为排除项,红色为高度相关项);
最终确定了两个重点原因:
- 付款后维护服务不到位,家长体验较差,导致未上课退费金额高;
- 付款后长时间未排班、排班时间不符合家长预期,导致未上课退费金额高。
这一步的重点是问题-假设-数据验证-结论方法,每一个指标的细节可以先不用看~
第五步:验证假设——如何验证假设,如何证明?
找到主要原因后,还需要证明该假设成立,因此我设立对照组,分别按照不同门店的退费金额,按服务质量好-差、成功排班速度快-慢,来进行对照数据分析,为了尽量排除干扰因素,选择了同一区域、人员结构类似的门店进行数据归类,经过排查,已能证明该因素确实是核心影响因素。
第六步:确定解决方案
虽然找到了主要原因,但还需要挖掘深层次的原因,继续重复上面分析的过程,接下来针对问题进行方案设计,提供对应的功能,并建议制定业务规章制度,以达到期望效果;在此过程中,值得注意的是并不是所有问题都可以通过产品功能解决,尤其是涉及流程调整、监管,是非常需要业务部门的支持、协助的;产品除了要产出方案,还需要组织会议,协调资源,推进达成共识,正式立项。
进行到这里,基本上能很完整的确定解决方案,并且整个过程均有丰富的数据支撑,可行性非常高,甚至可以预见几乎不会有上线误差。
最终: 我取得的成果
- 发现了退费环节的重要问题,并提供了建设意见;协调多个部门共同完成了项目管控、推进落地工作;
- 通过3个月的使用,再次检测数据:未上课退费率由70%降低为40%,已上课退费率无明显变化;
- 退费金额整体降低了30%,按照比例折算,整体利润增加了8%,超额完成目标。
1、源数据会对数据分析结果产生直接影响,在分析时,选取数据要尽可能覆盖全面、精准度高;此外要特别留意异常数据,一定要剔除因设备、软件、个人等原因导致的异常数据,这些数据一不留神会导致分析结果与实际客观情况大相径庭;
2、数据不是唯一的参考标准,虽然数据是客观的,但分析数据的人是主观的,同一份数据不同的人可能有不同见解;看数据的同时,需要结合个人对产品的一些既往经验,或者辅助用户访谈、问卷调研、A/Btest等方式进行综合全面的分析;
3、在结构化假设原因时,维度要尽可能的齐全,可以从用户、竞品、产品服务3个角度思考,并且对照着业务流程,来尽可能罗列相关影响因素;
4、当维度较多时,比较好的方法是将数据分组,观测每组数据是否有异常;比如按渠道入口分组,看是否某个获客渠道的数据异常,或按用户的地域/购买时间/下单频率等等分组。
三、方法论
1. 如何学习一门新的课程或知识
我开始以为数据分析是分析师才需要掌握的,并且觉得比较难;但随着工作上思考加深,发现方方面面都可以用到数据分析思维,所以萌生了加深学习的想法;这里推荐给大家【道术器用】四层次法,从思维、方法、工具、实践四个方向对照自己掌握的技能,逐步丰富自己的数据分析技能树,快速查漏补缺。同时这个方法也非常有助于思考深度的锻炼,可以应用到各个课程学习上。
2. 常用的数据分析方法
结合实际场景和需求,可以采用多种分析方法组合分析,下面是一些分析方法论:
3. 数据分析更多应用场景
不只是分析问题时可以用到数据分析思路,在职场汇报、简历编写、甚至购买基金,都可以找到数据分析的影子,可以尝试以下应用场景。
以上,就是我今天的分享啦,总结一下:数据分析代表了一种方法,一种辩证、推理、思辨的思维方式;不只是数据分析师、数据产品需要具备数据分析能力,每个人都可以应用这项能力给自己加分,把这项能力举一反三应用到生活和工作的各个场景中;用好这个“大招”,能更轻松地跑赢一部分人,更快地升职加薪,也能让自己的简历更突出。
本文由 @PM_dog9527 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!