数据分析中的硬实力与软实力「如何锻造解决问题的能力」

2 评论 5430 浏览 21 收藏 16 分钟

编辑导读:数据分析师作为互联网行业背景下诞生的岗位,听上去非常高大上,也有不错的职业发展前景。本文作者针对数据分析这个岗位进行了分析,与你分享。

本文来自知乎问答。

问题:想做一名数据分析师,自学了《统计学》、R、SQL等。入门级别的,现在有点迷茫了,下步学什么才是合适的?

我目前自学了《统计学》、JAVA、R、SQL、SPSS。但都是学到学门级别的,现在有点迷茫了,数据分析有那么多工具,不知道学哪些才是最正确的,不知道怎么规划了(问题重点)。我目前考虑的问题主要有两个:

  • 短期希望找到一份相关的工作(目前事业编混日子)。
  • 长期规划是做一名数据科学家不想走偏了。

正文:

同样是因为喜爱而转行踏上数据科学之路。

毕业工作后,业余时间我一直在关注人工智能的新闻,出于兴趣开始在晚上自学相关的理论知识、工具例如统计学、python。突然有一天,我心血来潮,忽然想通了,为何不投身喜爱的行业,要不然也只是空有一腔热血。

于是我便马不停蹄地开始学习Python,并决定从人工智能时代通用基础能力——数据分析入手。

但因为是零基础转行,所以刚入职很多都不会,挨骂最多的就是做的计划不落地、提的方案脱离业务场景……经历了许多项目、积累了经验后,我总结了以下能帮到你的经验。

一、工具篇——硬实力

从题主学习了这么多工具的经历,想必跟我一样是个“工具控”,接触到有趣又强大的工具会忍不住去学习。

现在我作为数据分析师,题主说的工具我都有在用,目前我在用的一些相关工具的应用场景:

1. Python

常用的数据分析工具,数据科学界的明星产品。几乎是万能的工具,尤其是在解决重复性工作、大数据分析等场景方面特别好用。在Python列入小学课程的时代里,它绝对是值回票价的编程语言。

2. SQL

通用的数据库语言,对于数据分析师而言,可以完成取数、分析工作。所谓巧妇难为无米之炊,SQL可以从源头上解决无数据的问题,要不然你是无法想象IT是如何拒绝或延后你的提数需求的。

3. SPSS

“傻瓜式”的数据分析图形软件,可以像操作Excel那样点点点,很简单地完成复杂的数据分析工作,例如相关性分析、回归建模等。

(如图为我在实战中使用SPSS进行特征挖掘的PPT)

目前我工作中,很喜欢用它的可视化决策树。在实际的数据挖掘工作中,可解释性是很重要的一环,它很多时候决定了模型的逻辑及结论是否被业务所认可。众多模型中,线性/逻辑回归在这方面绝对是老大,而在我发现了SPSS中将决策树模型可视化这个逆天功能后,它就成为了我分析的最爱之一,得益于易懂的可视化图形,它的逻辑与结论往往也很能被业务所接受。

4. R

数据科学界的老大之一,统治着专业的统计学、生物、医学等领域。目前我在用它,是因为公司的销售预测模型是其他同事用R语言写的。

R与Python的差异在于:R是统计语言,有很多优秀的框架,例如Python里最常用的Pandas库就是从R移植过去的,再例如可视化图表的库的表现一骑绝尘。但是在自动化办公、应用领域却没有Python广。

所以,建议刚入行的童鞋先学Python这个性价比高的语言,等有进一步明确的需求后,再按需学习R即可。

5. Power BI

非常优秀的可视化分析工具。在用Python做数据分析时,很多时候只能将分析结论可视化后黏贴到PPT里,对业务来说,他们更想要有可互动、动态更新的可视化分析结果。而这,就是我应用PowerBI的场景:数据导入后,建模分析,形成的分析报表业务直接点点点就可以感受到数据变化与特点。

但是PowerBI的建模思维有一定的门槛,而对于大多数分析师来说,Excel的图表已经可以满足。所以建议初学者先学习灵活应用Excel的可视化能力。

6. JAVA

是使用最广的开发语言,与数据分析关系不大。我之所以学它,是因为我负责的数据产品几乎都是用Java开发的数据接口,所以才需要懂一些基础。

想要从事数据分析工作的同学,不建议学习Java

7. 分析工具的优势

以上的提及的工具,建议挑选1-2个,如SQL+Python,进阶学习。最重要的是进行项目实战,可作为短期找工作的敲门砖。

掌握分析工具可以更快地在业务公司抢得眼球,可以应对复杂的业务需求。

工具无法解决的问题——对业务场景的理解

工具可以解决很多深度分析需求,但是重要核心还是用工具的人,分析思维还是要回归业务场景。

二、思维篇——软实力

职场里真正重要的是:解决问题的能力,而它由定义问题、找到原因、落地建议三部分组成。

业务需求的提出,简单地说,便是业务在运营过程中,发现了问题,故想通过数据分析找出问题原因所在,进而解决它。

1. 定义问题的能力

只有正确的问题才能指引数据分析工作往正确的方向进行。

从一个模糊的问题说起:今天领导提出,最近老客表现差了。

下面对领导提的问题进行剖析:

【观点与事实】

“最近老客表现差了”,首先这是一个观点,不是事实。

【还原事实真相】

作为专业的数据分析师拿到这样的观点之后,第一件事是要还原事实的全部:

  • 最近:最近是多长时间周期,这周?近三周?还是上个月?
  • 老客:如何定义老客?以往注册过、但并未消费的客户?还是说一定是有历史消费的客户?
  • 表现:哪个指标?重购金额?回柜人数?
  • 差了:是同比下降,还是环比下降,还是说增长幅度不及预期?

面对领导的业务观点,我们还原的事实是:上个月(2020年12月1日-12月31日),以往消费过的老客,在回柜消费时产生的消费金额,环比(与2020年11月1日-11月30日)下降了30%。

【事实与观点】

组建好事实集合后,要利用信度效度思维,重新审视领导的观点是否客观、合理。

信度:

代表的是数据的可靠性程度和一致性程度,反映数据的稳定性和集中程度

也就是说,数据计算结果之前的取数逻辑、数据清洗工作是否合理,是否符合业务场景逻辑?

效度:

指测量工具能够准确测量出事物真实情况的能力,反映数据的准确性。

简单地说,这样环比的比较是否有意义?例如品牌或行业属性是节日敏感的,上上个月有双十一大促,而12月是淡季没有活动,不论是横向与行业内其他公司,还是纵向按往年的经验,12月重购金额比11月下降20-30%是合理的波动区间。

所以,这样的事实似乎无法支撑领导的观点。

2. 寻找原因的能力

实际工作中,找到问题,并将它明确之后,就要抽丝剥茧般找到问题背后的原因,而这一定要回归业务场景本身,才能在理解业务的背景下,通过数据分析,找到原因所在。

【了解业务】——梳理业务流程

了解业务的过程,实际上就是在不断沟通的过程,这也引申出数据分析师职业特性:沟通、沟通与沟通!对此暂不展开讲。在与业务沟通的过程中,要尽可能多且深入地了解目前业务的动态,尽可以还原业务的全貌。

这个例子里,因为是在单品价格高的行业里,客户购买产品后,因为产品价值高,所以一般都会存在护理需求,所以售后政策是在质保期内可以免费护理1次。

而业务也正是找到了这个切入点,针对已享受过护理次数的客户,赠送免费的护理次数,以吸引他们到店来护理,而有了面对顾客的机会,自然也就有进一步销售的可能。所以现场还会准备新品、活动宣传等材料,处处精心营造成冲动消费的心理暗示。

【建立公式】——数据思维+业务流程

从业务流程中抽象出来:圈选目标客户 → 通过护理吸引到店 → 营销促销 → 消费。

应用数据思维,进一步抽象成公式:老客重购金额 = 目标老客数 * 到店率 * 转化率 * 客单价。

抑或用“人货场”业务思维进行讨论。

【理解业务】——搭建业务模型

基于公式,将流程建成立体的网状结构,形成针对某个具体场景的业务模型。

【数据分析】—— 找到问题所在

通过在业务模型的框架内进行分析比较,我们才能看到某一个业务的全貌,才能发现背后是哪个模块引出的问题。例如案例中,数据分析发现触达客户中,回柜率很低,问题可能在“老客”、“回柜”。

从历史数据上看,此次采取的吸引到店玩法都是很成熟的策略,有很好的成功案例,数据表现良好,所以问题可能就是出在“客户池”——运营维护部分,如没有分群营销。

3. 落地建议的能力

【KPI相关】

分析项目是否可推动实现很大程度上取决于是否切合业务KPI。

根据多次和业务合作的经验,尤其是对数字化决策不那么敏感的公司, 甚至是由上至下的数据分析项目,分析结论很容易沦为一纸报告,而不了了之。很大程度上,是因为分析建议与实际业务动态偏离,即并不是业务的考核重点。在资源有限的情况下,也就难以执行。

所以,在最后给落地建议的阶段,还是要回归业务,了解业务的运营计划,在现有的项目下,去试验、实践分析建议。

【符合实际操作】

不要尝试去改变业务习惯。

问题在于用户分群的问题,应用RFM模型进行精细化运营。一般来说,RFM模型分为八大人群,根据不同人群特点进行精细化管理,例如案例中,针对重要价值人群进行新品发布会邀请等差异化体验,针对重要唤回人群进行节日关怀策略等。

但是如果了解实际业务操作的话,对于零售企业来说,并不会按八个人群去实践,而是选其中的几个重要人群,或者进行二次组合,以减少客服部门的触达量。

知道这样的背景后,就不要再去建议说分成八个人群给不同的建议,而是有优先级地划出人群优先级,或者配合给人群合并运营建议等。这样考虑到实际操作情况,业务自然也能感受。

【分析深度】

另一个落地建议,就是一定要具体可行。

在已知数据分析结论不容易落地的情况下,将结论建议尽可能地具体,给出“令人惊喜的”发现,才能更容易去推动项目。

但是不要忘记数据分析与业务执行之间的边界,在大部分情况下不要尝试去给具体的落地计划,否则很可能会引起反效果。

如何做到具体可行?则需要纵向的分析深度:

分析模型的深度理解:

如图RFM分析案例中,但在我看来,RFM模型的’KPI’在于良性人群的占比提升。所以将门店RFM人群结构及关键数据进行同期对比,可以达到进一步分析的目的。

杜邦分析与指标拆解:

这部分内容可以参考:数据分析的结果该如何落地? | 人人都是产品经理 (woshipm.com)

 

本文由 @饼干哥哥 原创发布于人人都是产品经理,未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 写的不错

    来自广西 回复
  2. 大佬~

    来自北京 回复