优秀的数据分析师有哪些特质(二)?
上一期我们讲到了第一个特质,即优秀的数据分析师对业务具有深刻的洞察,进而从更高更广阔的视角定义要解决的问题。既然定义了问题,那就要定位产生问题的原因,本篇文章我们就着重分享原因定位的方法论!
我们先来回顾下解决问题的流程图(左图,改编自书籍《如何用数据解决实际问题》),以及数据分析师的能力框架(右图,百度DA的晋升能力体系)。
我们可以看到,如果要解决一个问题,首先我们要准确地定义这个问题(按照上期所讲,这个需要有深刻的业务洞察能力),然后通过一系列的数据分析,定位原因,最后讨论并实施对策(即实现项目影响)。左右两个图对比,我们可以看到,数据分析的能力框架并不是天马行空想出来的,它是从解决问题的流程中提炼出来的。
你们觉得这四大核心能力中,哪个能力最能体现数据分析师的价值呢?
在我看来,无疑是原因定位(这也是我把原因定位放在最中间的原因)。为什么呢?我先给大家讲个故事。
据说,有一次,美国一个大公司,电机发生了故障,把公司所有内行人请来也找不出症结所在。没有办法,只好派人乘专机将一个德国专家请来,德国专家问了业务人员电机以往的使用情况,看了下相关的数据,然后围着像一间房大的电机转了起来,他一会儿敲敲这,一会儿听听那……大约一个小时后,专家拿起粉笔在电机上最不起眼的部位划了一道线,对在场的工人说,把这里打开……
电机被打开了,故障,原来真在这里!
德国工程师索要1万美元费用。周围的人不理解,问道,用粉笔划了这么一道线,就一万美元,我们辛辛苦苦干一个月才几千元?工程师见他们不理解,就笑着对他们说,我拿粉笔划这一道线,只有一元钱,可是我知道在哪里去划,要9999美元。
看完这个故事,大家再想想就应该明白了。无论是业务洞察还是数据分析,都是服务于原因定位。而当原因定位好之后,如果和你配合的业务人员足够优秀,实现项目影响自然也是顺理成章的事情(就像故事里的工人,在看到故障后不需要专家指导自然就知道如何维修)。
01
接下来我们就详细讨论下原因定位的方法论。 当我们接到一个问题的时候,最忌讳的就是不经思考直接去看各种数据,迷失在数据的海洋里,纠结于不重要的数据细节中。我们要做的是先对问题进行拆解,把分析思路梳理清楚了,才能有的放矢。
拆解问题有两种方法:一种叫假设拆解(咨询公司叫做假设树),另一种称为逻辑拆解(咨询公司叫做议题树)。
假设拆解,顾名思义,就是对问题的原因列出一个个的假设。这种拆解问题的方法门槛比较低,无论是业务小白,还是资深大咖,当面临一个业务问题时,大家自然而然都能提出一系列的原因假设,进而通过数据分析验证真伪。
举个例子(案例和数据都是示例,非真实情况),微信的数据分析师小明发现,从9月11日左右开始,每日成功发送红包的总金额(即红包被抢了且成功转账的金额)逐步下跌,在此之前,这个指标一直都比较平稳。
看到这个现象,大家可能有很多假设:
- 微信内部上线了某些新功能(比如发红包的上限从200元降低到100元,用户更多的使用转账),对红包功能有负面影响。
- 暑假结束开学了,学生党花销变少了,所以家长给孩子,以及学生党之间发的红包变少了。
- 竞对(比如支付宝)的红包功能开发了新玩法,对微信红包有负面影响。
假设拆解方法的优点是,如果对业务了解深刻且幸运的话,可能提出的第一个假设就是问题的核心,又快又准地定位原因;风险是人们建立假设时,很容易依赖工作中的常识、自身的经验或直觉,可能会无意识地排除一些重要的假设。
如果这些遗漏的假设恰好是问题的根源,就会陷入假设-》证伪-》再假设-》再证伪….的死循环中,这样只是花费了大量的精力排除掉错误的假设,真正的原因却迟迟找不到。
逻辑拆解方法能很好地降低遗漏。 互联网产品中常用的逻辑拆解方法,包括漏斗拆解和指标拆解。如下图,就是按照用户发送以及对方接收红包的操作路径来拆解。
下图是指标拆解,即运用“四则运算”将指标拆分成具有业务代表意义的n个具体指标,再结合重要的维度进行拆解分析。
我们可以看到,定位原因最好的方法论是逻辑拆解和假设拆解配合使用。逻辑拆解的最大好处是不重不漏,能帮助我们快速地定位问题的核心要素。这个时候运用假设拆解法,提出可能影响这个要素的假设,我们找到核心原因的成功率就会大大提升。
好啦!方法论讲完了。有些读者可能会说,其实这些没那么难,我早就知道了。可是,世界上最难做的事情就是知行合一,从知到行还远着呢。 我们每个人都知道饭前洗手,你想想你每次都能做到吗?嘿嘿!
02
除了原因定位的方法论,我还有两个重要建议提给大家。
(1)越重大的问题,越要使用逻辑拆解
正如上述提到,假设拆解是门槛很低的方法,所有人都能对问题提出几个假设。我在面试应届生架空分析题目的时候,80%的候选人都是用假设拆解法,很少有人有逻辑拆解的意识。
同样的,在我们遇到一个重大的问题时候(比如电商GMV下降),关心这个问题的人也会很多,通常大家就会七嘴八舌提出自己的想法,而这些想法会局限在他们自己所负责的范畴。比如技术同学担忧是不是推荐算法不好,推荐的商品用户不喜欢, 供应链同学担心是不是货品不够全面,运营同学担心是不是优惠力度不如竞对,甚至有时候大佬们也会抛出一两个假设。
每个业务方都紧张兮兮,都想请你用相关数据证明问题的核心不在他们。如果你被他们的假设牵着鼻子走,最终可能就是帮他们排除掉了一个个与他们相关的假设,但真正核心的原因还是没有找到, 老板肯定不会满意。
你总不能和老板说:“老板,我们花了3天时间,做了大量的数据分析,最后我们排除掉了以下10种可能性。”
老板一句“那原因是什么呢?”就能把你怼的体无完肤。
记住,原因定位永远是以找到正确的原因为最终成果,排除一系列潜在原因不是交差的正确姿态。所以,越是重大的问题,越要采用逻辑拆解,这样你才能快速地定位关键因素,为找到最终原因奠定好的基础。
(2)除了海量的数据分析,别忘了用户调研!
为什么在这里着重提到用户调研,主要是由于数据分析师的两个认知误区。
误区一:进入大数据时代后,有时候我们会过度依赖用户的行为数据,例如点击、观看、使用时长等,却忽略了这些行为背后的用户需求。好的产品,都是以满足用户的核心需求为目的。异常的产品使用行为数据背后,都应该有一个合理的用户需求解释。 否则知其然而不知其所以然,怎么能有好的业务对策呢?
误区二:在实际工作中,很少会遇到所需数据全都摆在眼前的情况,用户调研能从另一种角度提供所需的信息。
举个例子,在工作中,最让我头疼的就是留存下降的分析。留存下降,说白了就是用户不像以前一样喜欢你的产品了。这就像你的男/女朋友说不爱你了一样,潜在的可能原因或者干扰因素太多了。
当我做切片分析的时候,我希望能从年龄、注册时间、职业、地域、教育水平、收入水平、工作繁忙程度等各个因素进行分析,甚至希望对比他们的竞对使用数据。但是很可惜,我想要的数据大部分都是没法获得的。
即便这样,也不应该根据“现有数据”来开始所有的工作。只在“现有数据”的范围内进行分析,最有可能的结果就是找不到原因,陷入分析困境。这个时候,通过线上的调查问卷,或者与用户一对一访谈,能给我们提供想要的信息,甚至是行为数据里挖掘不出来的insight。
看多了百万、千万数据的分析师可能会质疑,几百个用户的问卷能具有代表性吗?
在大数据流行之前甚至现在,知名的咨询公司仍旧采用问卷或者访谈的形式,辅助解决了很多复杂问题。 很多时候,以点撬面,以深度换广度,也是解决问题的一个思路。
本篇文章到此结束啦!下一期,我们将一起讨论数据分析的本质和常见误区!点击关注,不迷路奥!
作者:阿娇;公众号:后厂村AJ
本文由 @阿娇 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
1,为啥前几篇内容也还不错,但阅读量那么低?
2,在百度呆到P6就差不多可以走了,大厦将倾,出去看看会更好
3,后续发展要是不局限在数据分析师,就会有更大的空间和不同的视角了
1、这个要问问平台了,为啥阅读量低
2、我17年就跳槽到快手了 🙂
3、虽然现在顶着分析师的title,但实际上已经越来越做业务了。 😉
好赞~
谢谢支持
👍!希望博主姐姐快快更新 哈哈哈