没有数据,咋做分析?偷偷给你三大法宝!
编辑导语:说到数据分析,大家第一反应肯定是数据,不少人都认为数据分析没有数据是做不成的。但是,如果真的遇到了没有数据或者数据不足的情况,应该如何推动数据分析呢?本文作者为我们总结了这三大法宝。
有个朋友私信我,找我抱怨他的苦恼。他花了5位数报了一个数据分析班,分析思路、方法论学了一大堆,结果在公司用不上!原因是因为没有相应的数据!
他一边哭诉无良培训班,一边心疼自己的血汗钱。搞的我这也很尴尬,同理心瞬间爆发,直接代入到培训班老师角色了,各种安慰起来。聊天记录就不发了,太尬了!
不过事后一想,这事情不是这么简单的,我不是给培训班洗地哈,因为这个问题还真值得说一说。
一、从斗地主说起
也是,都说数据分析师能开启上帝视角,统揽全局,然后进行科学决策,最大程度的提升企业竞争力。但是哥们说了,没数据你说个毛线啊!没数据,这上帝视角仿佛也被乌云给遮住了,只看个只言片语,咋分析啊!
不过,谁说不能掌握全局信息就不能科学决策了?各位过年斗地主赢钱了吗?我整个假期都在写原创文章,可没功夫玩斗地主。但是不妨碍咱拿斗地主说事儿。你是不是觉得有些搞笑,斗地主跟数据分析、科学决策有啥关系啊?
这关系可大了去了!可以说斗地主就是一个非常经典的数据分析应用场景啊!你看:每个人抓牌之后,只有17张牌,地主20张牌。每个人都并不掌握全局的信息。目标又很清晰,需要三方决战,己方获胜才行。
每个人能看到的信息只有手上的17张+3张底牌,也就是说每个人都是在信息不足的情况下进行决策,期望率先出完手中的牌,获得胜利。新手打牌呢,基本上就看着手上的牌机械的对应出牌,能管上就管,管不上就过。
老手打牌呢,就会拓展所有信息来源,扩充自己的信息资源,仅凭已知的牌就能推断出非常多的信息。
比如,手上17张牌,起码能判断出自己的断张牌,这些都能识别为风险;根据手上的王、2、A、K的张数,能推断出大牌的大致牌力分布;根据手上的3带、4炸的分布,可以确定其他二位的断张情况,从而推断其他人的牌型。
比如你手上有3张或者4张7,再根据自己手上的牌,那基本上可以确定上下手的小牌大概率会比较零散。除了这些之外,老手还会看地主、农民的位置,3张底牌也是很重要的信息。到现在,才是观察自己的牌型分布,找到牌权,确定控场策略,规划出牌战术。
这还不算完!因为以上这些,都是刚拿到牌的时候可以了解的信息。在上下家不断出牌的时候,老手会不断的收集新的信息,帮助他不断确定上下家手中的牌,甚至还会主动出手试探。
比如你是地主,手上有1个2,就可以先出一个A试探2的具体分布。出2管你的大概率也是一个2,另外一方基本上就是一对2了;如果有人直接出小王管,那基本上可以肯定外面3个2在一起了。
这时候如果手中有大的3带,就得找机会出,消耗掉对方的3个2,这样我们其他稍微小一些的牌就能拿到牌权了。
你可能会说,这不够精准啊,会猜错的,万一就是有人有2就是不管咋办?
咱推测的前提是大家都是正常人哈,捣乱的不算,但是更不怕了。我看过不少精彩牌局,有经典牌局霸气到直接判定逃跑的一方手中只剩对4,炸完对方打牌后,打对4挑衅对方的场面,他们判定的真的非常精准。
当然,超强的记牌能力也是必不可少的。2020经典牌局第一名,打到最后,三个人手上只有一张2,其他全是7以下的小牌。就这还惊心动魄的来了三四个来回,最后拿2的稳若泰山,巍然不动,坚决不出2,逼地主出对3,放队友对4赢得比赛。
二、数据生崽术
所以,没数据咋办?咱学斗地主啊!你看,斗地主也是缺乏数据对吧?我们是怎么做的?
- 充分读懂手上的牌,怎么读?区分牌权、大牌、7/10等关键牌、断张;
- 结合角色、位置、手牌和底牌,推测其他角色手牌牌型分布;
- 结合自己的牌型、牌权、单张、角色和位置,规划出牌战术,如果是农民,需要确定主跑还是配合;
- 在后续出牌的时候,一方面要记关键牌,另一方面可以不断推测其他双方手中剩余的牌力牌型,然后针对性的进行拦截、攻击、引诱和试探。
咱把这些抽象一下,然后应用到数据分析领域上:
- 充分读懂已有数据。怎么读?给现有数据打标签,让数据生个崽儿;
- 结合市场动态、业务场景、参与方等信息,推测其他参与方信息,作出粗略判断;
- 结合自己已有的信息,规划运营策略;
- 布置运营策略监测指标,不断观察其他参与方(如客户)的反应,推测其根因,然后针对性的进行运营策略调整。
比如最简单的一个场景,咱拿到了一个这样的数据,数据量有几十万:
乍一看,信息量太小了,啥也没有,根本啥也代表不了么。我先给你一个法宝:数据生崽儿术,咱先给让数据生个崽儿,咋生?
1. 打标签
所有的日期可以打标签吧?月末、月尾、工作日、星期、周末、节假日,这些都是常规的,弄个日期维全都有了。
所有的时点也可以打标签吧?出行的:早高峰、晚高峰;吃饭的:午饭、晚饭、夜宵高峰;人群活动的:上午、中午、下午、夜晚、深夜、凌晨等等。
所有的地区也可以打标签的吧?一二三四线城市、旅游、文化等等。
订单数也是可以分级分类的吧?小单量、中等单量、大单量、爆单等等。
2. 其他参考数据
打标签这件事情咱可以想很多很多,但是这还不够!咱还可以找到一些引子,引出更多可以参考的数据。比如我们有时间,是不是可以引出去年同期的数据?
去年的数据没有啊?那我们还有城市,可以引出城市相关的其他数据,常住人口、人均收入、GDP等数据;同时,我们还能引出该城市的行业数据。
如果咱分析的是餐饮数据,那就可以看看商圈、餐饮分布、平均消费能力、口味偏好等数据;如果咱分析的是出行数据,那就可以看看职住情况、平均拥堵、平均路程消耗、私有车保有量、天气情况等等数据。
这些都是公开数据,也不需要你花多少时间,都能拿到手。
3. 业务数据
咱除了这一张表格之外,是不是还能获取更多的相关的数据?
一方面可以横向拓展,这是业务表现,是最终结果。往前是业务运营,各种活动的数据,再往前是客户运营等等。单从业务表现往下深挖,订单的前后环节(访问、加购、下单、付款、退款等),订单的构成(产品类目、客单价、渠道等)。
啥?你说没权限拿到业务数据?行。没问题,咱还有招!
三、业务反推术
数据现在变多了吧?啥?你说好像还是没啥分析思路?这里我得多问你一句,什么叫分析思路?是分析套路?分析模型?我认为都太片面了。
我理解的分析思路是用数据抽象、整理出真实业务场景的路径。你看AARRR、客户生命周期、杜邦分析法、OSM模型等。所以想要分析思路,咱得逆向从数据中反推出真实业务场景。
当然,但从数据上并不能完全推断出来,所以我们还得用另外一个法宝:业务反推术。我们从数据上能反推出一些,但是现有数据不够啊,所以我们还得继续获取信息,获取这些信息最好的方式就是找业务人员聊。
哥们说了:我这是在面试啊,没办法访谈业务人员咋办?放心,面试本质上就是一个沟通、谈判的过程。不是高考答题,不让你问问题。没有业务人员,你可问面试官。
1. KPI分析法
问那些呢?
一个取巧的方案:KPI,KPI有非常多的好处,一方面体现了公司的发现方向;另一方面也会告诉你当前业务的核心点。
因为没有那个傻子把KPI设置成跟业务没关系的指标上的,而且最关键的是这些KPI之间是有非常重要的关联关系,并且有评判标准!这是非常有价值的数据。我们不仅可以反推商业模型,甚至连业务流程都能梳理出来了!
2. 业务流程分析法
当然如果是在面试,问KPI就没啥用了。我们可以直接问背景、业务目的、业务流程和其他业务特征。然后再结合数据,就能反推出完整的商业模型、业务框架、业务逻辑了。
四、分析模型构造大法
可能你还是会说:我现在非常理解公司的业务,但还是没有分析思路啊,更不用说上面那个例子中的那些数据了。
怎么说呢?你说在第一个数据分析模型/思路出来之前,这世界上是咋编出来数据分析模型/思路的呢?这不是废话呢么?当然是人想出来的啊!
对啊,你我都是人,我们怎么不能想出来思路呢?分析模型/思路越通用,在使用的时候就越不得劲啊!来,我来给你第三个法宝:分析模型构造大法!
1. 代入业务流程
一些数据摆在具体的业务场景中,这含义就会非常清楚。所以有一大类数据分析思路其实就是业务流程式分析,AARRR、生命周期等都是。
2. 横向对比
如果还想进一步分析,那就做横对比,时间层面同比、环比,看增长;地区层面同级别对比、区域性对比,看差异,其他维度同理。
3. 纵向深入
按照MECE的原则,一步步纵向拆分指标数据。其实杜邦分析法、构成、下钻等分析方都是纵向深入的好工具。
4. 业务重构
根据我们对业务的理解,进行解构、重组,最后抽象出来,就有了各种业务分析套路,比如人货场、三流、OSM等等。只要业务理解深,抽象手段熟练,模型思路要多少有多少。
五、总结
完美的上帝视角是不存在的,因此数据分析永远是在缺少信息的情况下不断逼近真实情况,做出精准决策的过程。
斗地主其实就是一个非常典型的数据分析应用场景,同样没有完美的上帝视角,同样缺少信息,但是又得做出精准的判断。
新手打牌只会看手中的牌,老手不但会分析手牌,还会看位置、角色,从而规划自己的战术,还会不断被动、主动收集各种信息,进行准确判断,不断修正出牌策略,最终获得胜利。
我们做数据分析也是一样一样的,用“数据生崽儿术”拓展更多数据,可以用打标签、获取参考数据和业务数据等方法;再用“业务反推术”不断逼近真实业务场景,可以使用KPI分析法、业务流程分析法等方法;最后用“分析模型构造法”建立分析思路,提炼对应策略,有代入业务流程、横向对比、纵向深入、业务重构等具体手段。
这些招数一用,再少点数据,我们也能说出个12345来,不信你试试?
#专栏作家#
大数据架构师,微信公众号:大数据架构师,人人都是产品经理专栏作家。国药国华大数据总监,擅长BI、数仓、数据中台产品规划领域。
本文原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于 CC0 协议
知道打牌总是输的原因了~
但是斗地主和数据分析有一个不同点吧,斗地主的数据总量其实已经固定了,但是工作中做数据分析时数据量并不固定呀,小白观点哈,嘿嘿
不同点有很多很多啊。
但是咱并不是在玩大家来找茬,而是想通过斗地主说明即便是信息不全面,也照样可以科学决策。