如何开展数据分析?–产品经理
数据分析是产品和运营都必须掌握的技能之一,但不少同学接触较少还是不怎么会。本文分享了产品经理如何做数据分析的流程和方法,供大家参考。
小A:
“这张曲线图真好看,怎么做的”
“这些数据可以做什么样的分析”
“高级的分析方法在这里能用吗”
“要做多少张图表”
小B:
“数据变化的背后真相是什么”
“从哪些角度分析数据才系统”
“用什么分析方法最有效”
“数据分析的目的达到了吗”
小A和小B在做数据分析的时候分别思考了相关问题,不难看出,小B的问题对于数据分析来说价值更高,也更专业;而小A就是以前的我,在收到数据分析任务的时候,总是找不到重点、随意发散、无法聚焦,结果也总是不尽人意;通过多次的经历与不断复盘,摸索并验证了一条真实可落地的思路,和大家探讨一下。
常见的数据分析全流程一般是:明确分析目的→确定分析方法与思路→数据加工→得出结论
一、明确主题
主题可以是封闭的,如“广州机场1期项目的隐患整改率指标能否符合预期”,也可以是发散的,如“当前公司供需匹配的矛盾是什么”,需要根据公司具体情况确定分析目标。
整个分析过程就是对业务的诊断过程,从浅到深、从大到小,下面我们通过一个案例,来贯穿整个流程。
案例:
需对小Y公司零售业务销售额下降进行数据分析。
小Y公司在2024年前4个月销售额持续增长,但在5月份的销售额却出现了一定程度的下降,具体数据表现如下:
全国5月份比4月份整体下降362千元。
二、分析思路
1. 首先是数据校验
1)校验数据准确性
是否因系统上报错误等异常原因导致,如检查数据获取渠道、sql是否有误、数据看板是否及时更新;
2)异常还是波动
拉长时间轴对比查看观测日数据是否异常;
最终确定数据准确且是异常变化,再进行后续分析。
2. 其次是确定方法
我常用的分析方法一般是:假设验证、逻辑树、5W2H
1)假设验证
提出假设→验证假设
我们用上面提到的小Y公司案例进行分析:
假设可能是某个区域的销售额下降,导致整体销售额下降,获取到更细力度的数据后,用excel对基础数据进行透视,观察分区的销售额变化情况:
通过观察发现,北京、河北5月份的销售额明显下降,其中北京下降幅度最大,因此猜测北京销售额下降是导致全国销售额下降的首要因素。为什么北京的销售额会下降呢?是整体下降?还是某个品类下降?为进一步分析,需对各区域的数据进一步按品类分组观察如下:
通过观察,北京蔬菜品类5月份下降明显,从423千元下降到40千元,降幅达90%,而海鲜和水果基本稳定。因此基本可以确定销售额下降主要是因为北京地区蔬菜品类销售额下降导致的。
若此刻下定结论,也许不够严谨,因为河北的销售额也有所下降,大胆推测一下:全国的蔬菜品类是否因为某些原因出现了整体下降呢?
我们这次从分品类分区域的销售额维度进行观察,数据表现如下:
观察发现,全国海鲜品类销售较稳定,水果品类持续增长,蔬菜品类在5月份的销售额明显下降。广州和深圳的蔬菜品类销售额是增长的,只有北京与河北两地的蔬菜品类销售额明显下降。
考虑到北京与河北两地相连,猜测可能是同一原因导致的蔬菜品类下降。因此我们询问了华北地区采购员,得知5月份蔬菜品类的华北地区供应商货品质量大面积出现问题,导致严重退货。华北地区供应商是北京与河北客户采购商品的同一供应商。
至此,得到了明确的分析结论:华北地区蔬菜品类出现严重质量问题,导致北京与河北的销售额骤减,进而导致全国销售额下降。
这里的分析工具只用到了excel的数据透视,还有其他如BI软件,也可以从各个维度探查数据,大家可根据自己的实际情况选择合适的分析工具,只要能达到最终分析的目的即可。
2)逻辑树:
通常会将公式拆解、用户/产品/竞品三维度拆解,用逻辑树来体现。
如:GMV下降
i.公式拆解:为访客数、订单转化率、订单均价进行进一步分析。
ii.三维度拆解:用逻辑树体现如下
3个维度不断细分,进行分析。
3)5W2H:同样用逻辑树体现如下
这个方法作为产品经理应该再熟悉不过了,我做需求调研的时候也经常用到这个方法,简单清晰,覆盖的范围也比较全面。
3.最终得出结论
数据分析的结果一般会以分析报告类的文档呈现,分析报告结构可以按照总分总的形式编写,如提出论点、进行论证、陈述总结。
报告中要注意:标题、数据来源、格式与排版等。
三、数据加工
数据分析过程离不开数据加工,一般收集来的数据,都要做一些清洗、处理等操作,以保数据的准确性与可信度。
专业的数据加工工作一般是由数据分析师等职位的同学执行,产品岗的我们,能执行一些必要的处理工作即可,如对excel相关公式的使用、BI软件、埋点平台的使用等,当然如果对数据加工过程也能掌握肯定是更好的。
数据加工的过程一般包括:
数据采集、数据预处理、数据存储、数据处理与分析、数据可视化、数据服务产品化。
1.数据采集:从各种来源(业务系统、日志文件等)收集原始数据,需要保证数据的完整性和准确性;
2.数据预处理:收集到的原始数据进行清洗、去重、转换等操作,消除数据中的噪声和异常值,提高数据质量;
3.数据存储:将预处理后的数据存储到合适数据存储系统中,如分布式文件系统(HadoopHDFS)或数据库(NoSQL)
4.数据处理与分析:使用各种技术和工具对数据进行分析,如统计分析、机器学习等,以发现数据中的模式、关联,应用于决策支撑
5.数据可视化:分析后的数据通过图形化的形式展示出来,帮助用户更好理解和使用数据,常用的可视化工具如tableau、power BI等
6.数据服务产品化:经过处理和分析的数据应用到实际业务中,如推荐系统、风险管理等,需考虑数据的真实性、实时性与可靠性,以满足业务需求。
这里仅做一些简单介绍,感兴趣的同学可自行查阅~
四、总结
在整个数据分析过程中我认为方法工具、业务知识、细心耐心三者都很重要。事情的执行总是由简到繁、由陌生到熟悉的。我一开始做数据分析的时候很难聚焦,总是找不到出发点或分析点,像个无头苍蝇一样,什么数据都想要,最后结果分析不到位、缺少重点。在很多次的摸爬滚打中,逐渐找到了适合自己的方法,拓展了思路。
小Tips:如果实在不知道怎么做/迷茫的时候,就先开始,动起来再说。
今天的分享就到这里了,希望可以帮到你,欢迎大家一起交流学习。
本文由 @不知名产品露 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
- 目前还没评论,等你发挥!