如何避免掉入陷阱?首先你要学会做个讲逻辑的产品经理
数据是个很好的东西,可以帮助我们做出相对客观的产品决策。但是数据中也存在着很多的陷阱,如果我们没有很好的逻辑分析能力,很可能会被数据玩弄而做出愚蠢的决策。今天,咱们就结合工作可能遇到的一些陷阱来聊聊这些数据陷阱以及怎么避免掉入陷阱。
开始之前,我们先看看几个大家在工作中可能会遇到过的案例吧!
- 购买A类商品的用户当中有80%的都是甲类用户,因此当发现用户是甲类用户时,应该给用户比一般情况下推荐更多A类商品
- 当乙值增加时,B功能的转化率降低,因此应该限制乙值在一定水平
- 用户调研发现90%用户喜欢C功能,因此我们需要增加C功能
- 根据现有数据发现,D值相对较高的商品有更高的点击,因此应该把D值高的商品的排序提前
- 使用了E功能的用户比没使用E功能的用户转化率低,因此应该将E功能下线
大家应该猜到了,这几个例子肯定是掉进数据陷阱的描述,所以不妨先想一想这几个描述问题出在哪里,如果你想不明白,这篇文章建议你看三遍。
1.购买A类商品的用户当中有80%的都是甲类用户,因此当发现用户是甲类用户时,应该给用户比一般情况下推荐更多A类商品
逆命题陷阱
第一个案例的陷阱迷惑性很大,在实际工作中,我也经常碰到拿着这种描述来要求在某些场景下对某种类型商品给予更多流量的需求。从数据中,确实可以说明购买A类商品中甲类用户偏多,但是这能够说明甲类用户比整体用户更偏爱A商品么?显然不是,案例如下表:
假设A类商品和非A类商品的需求都是50,平均情况下A类商品和非A类商品的流量分配应该是50%:50%。虽然在购买A类商品中的用户甲类用户占比为80%,但甲类用户需要A类商品的只有45%,还没有到正常平均情况下的50%,原因就是因为购买了非A类商品的用户甲类用户的比例高于80%。
这个陷阱叫做逆命题陷阱,逆命题应该是高中数学中的概念,如果你忘了我们举个简单的例子,如果有个判断语句“如果于谦是郭麒麟的父亲,那么郭麒麟是于谦的儿子”,“如果郭麒麟是于谦的儿子,那么于谦是郭麒麟的父亲”是它的逆命题。逆命题有个特点,那就是当原命题是真的时候,逆命题不一定为真。再有一个例子,“如果小明是人,那他一定是哺乳动物”的逆命题“如果小明是哺乳动物,那么小明是人”就是不正确的,因为小明有可能是猴子。但是如果一个命题是真的,他的逆否命题一定为真,比如“如果小明不是哺乳动物,那他一定不是人”。本例中,“购买A类商品的用户更可能是甲类用户”为真,但它逆命题“甲类用户购买的更可能是A类商品”就是错误的。
这些简单的逻辑学概念和定理,我相信大部分人是了解的,但是在实际工作往往忘记了这些基本的原理而做出一些愚蠢的决策。对于那些不怎么了解的人,只需要记住一条:小心逆命题,别随便把推断的话反过来说。
2.当乙值增加时,B功能的转化率降低,因此应该限制乙值在一定水平
相关和因果陷阱
数据分析是帮助我们找到产品问题/机会的重要手段,相关性分析是数据分析中最常见的方法,我们常容易犯把相关关系当因果关系的错误。关于相关关系和因果关系的描述,最著名的例子是冰激凌和溺水死亡率的例子:通过数据统计发现,冰激凌销量增加时,溺水死亡率也显著增加。那是不是可以限制冰激凌的销量来控制溺水死亡率呢?对于风马牛不相及的推断,正常人都会嗤之以鼻。冰激凌的销量和溺水死亡率只是存在相关关系,这种相关关系的产生是因为在深处有一个相同的原因:气温的升高。但冰激凌的销量明显不是溺水死亡率高的原因,因此不能靠限制冰激凌的销量解决溺水死亡率高的问题。但不幸的是,我们大多数人还是会犯同类型的错误,比如2。
这个例子中,乙值的增加和B的转化率降低应该都只是某个深层原因的结果,但在描述中我们把B转化率的下降归咎于乙值的增加,这就是我们错把相关关系当因果的原因。对于如何避免这类错误,我们需要做的是尽量看到数据所体现的深层原因,将每个数据变化都对应到产品相关的实际因素中去,比如需求的变化、供应的变化、功能的改变、环境的变化、竞对的动作等等,而不是让数据分析只停留在数据层面。
3.用户调研发现90%用户喜欢C功能,因此我们需要增加C功能
4.根据现有数据发现,D值相对较高的商品有更高的点击,因此应该把D值高的商品的排序提前
既定规则陷阱
在需求挖掘的方式中,个人非常愿意将用户调研的吐槽部分作为发现问题的渠道,但绝对不会将用户调研的建议部分作为产品机会的直接来源。原因很简单,用户的不满是真真切切存在,他们也懂得如何表达不满,但用户的建议受既定规则的影响往往是不靠谱的,就像那个福特汽车的例子:在汽车出现以前,所有的用户只想要一匹更快的马。如果人人都能提出靠谱的建议,还会有乔布斯张小龙这种被你们奉为神的存在么。
我一直对用户调研持谨慎态度最深层次的原因,是因为所有的用户几乎都受到了既定规则的影响,这种既定规则的影响,也给了我们设下不少的数据陷阱。比如3,我曾见过通过“用户竞对app使用场景调研”的结论得出“我们应该增加C功能(和竞对一样)”的决策的例子,我想说的是:之所以许多用户觉得C功能不错(或者在使用C功能),是不是仅仅因为竞对提供了这个功能并且放在了明显的位置呢?当然,如果你说用户已经习惯了这种操作方式,这个结论也对,做这个功能也不会犯大错。但如果始终采取这种方式做需求,那么恭喜你,你又在不知所以然的道路前进了一步。另外分享个最近的思考题:现在手机屏幕越做越大,是不是因为用户说了想要更大屏的手机呢?但是用户真的需要大屏手机么?大屏手机到底有什么好?
在用数据说话的策略产品中,也可能存在这样的陷阱,比如4中通过对现有的数据分析发现D值高的商品点击量更多,得出应该将D值高排在前面的结论。在排序中,被排在前面的item必然比排在后面的item有更高的点击,如果在之前的排序策略已经有了和D强相关的D1的特征生效,那么必然D值高(因为D1高)的item就会有很高的点击。因此“D值相对较高的商品有更高的点击”很可能只是因为本来D值高的排在了前面。如果你把D值加入到了排序当中,很可能会做无用功,也因此在策略相关产品增加特征时,需要考虑新增特征是否和老特征正交。
对于既定规则陷阱的规避相对困难,这也是创新之所以难的原因。那一句非常虚的“挖掘用户深层次的需求”是避免错误的不二法门,谨记要think out of the box。
5.使用了E功能的用户比没使用E功能的用户转化率低,因此应该将E功能下线
数据统计陷阱
这是最近同事在处理需求遇到的一个问题,本来大家都信心满满的一个需求,上线之后发现使用了E功能的用户的转化率还不如没有使用E功能的用户的转化率高。如果停留在表面的数据分析,大多数人可能会做出需求下线的决策。但是真的对么?产品对比试验是我们经常使用的决策方式,这类试验有一个基本前提那就是单一变量,要求进行对比的两组用户除实验变量之外的统计特征是相同的。回到案例,使用了E功能和没使用E功能的用户特征相同么?假设使用了E功能的用户转化率为5%,没使用的转化率为10%,或许,有没有可能在没有E功能之前,使用了E功能的这批用户的转化率只有1%?
在这个陷阱中,让我们中招的是对数据取样的错误处理。除了数据取样,我们还可能遇到各种统计陷阱。对于这类陷阱,我们要时刻注意的是对比试验中的两组是不是单一变量:是不是同一群用户?是不是同一种场景?其他功能有没有对结果有干扰?等等等。
通过对上面几个陷阱的分析,不难知道如果能够将上面说的陷阱具体内容描述抛开,抽象成具体的逻辑问题,结论的正确以否还是很容易判断的。总之产品经理心里要保有批判性的看数据的意识:做决策之前多想想数据和决策之间有木有正确的逻辑关系,做个讲逻辑的产品经理吧。
作者@ hihipm
来源@策略产品经理讲堂(公众号ID;hihipm)
本文由 @hihipm 授权发布于人人都是产品经理 ,未经许可,禁止转载。
看到了《精益数据分析》中的内容。。。。
文章不错,有点个人的借鉴,忘海涵!!!
1.对于第一点的逆命题逻辑,虽然看似是个坑,但是我觉的还是应该给甲类用户推荐a类产品
原因是:对于平台产品的个性化推荐中,购买A类商品的用户当中有80%的都是甲类用户,我们其实可以得出,甲类用户有意向购买A类产品,这是毋庸置疑的。只不过推荐的比例和数量需要多方面的数据进行整合开计算。
2.其他的几个逻辑点,我觉得还得根据实际情况来判定,有时候确实是这种原因不是坑!!!(当然绝大多数是坑) 当然题主讲的确实不错。受教了!!!
文章不错,时时刻刻要提醒产品狗不要想当然,咱们看文章觉得这几种毛病自己不会犯,但是实际工作中稍不留神就会掉入数据陷阱,自己还洋洋得意呢
最近在学习数据分析,这篇文章对我有启发。
这不是陷阱的问题,是片面性的问题
主要明白这篇文章的主要内容和想表达的观念就好,每个人说一件事的时候都是不同的方式,如果仔细去想总会有一些漏洞,只要提出了核心思想,其余的就自己去幻想去丰满吧,很好的文章,值得推敲和学习。
警醒自己不要掉坑
1.购买A类商品的用户当中有80%的都是甲类用户,因此当发现用户是甲类用户时,应该给用户比一般情况下推荐更多A类商品
2.当乙值增加时,B功能的转化率降低,因此应该限制乙值在一定水平
3.用户调研发现90%用户喜欢C功能,因此我们需要增加C功能
4.根据现有数据发现,D值相对较高的商品有更高的点击,因此应该把D值高的商品的排序提前
5.使用了E功能的用户比没使用E功能的用户转化率低,因此应该将E功能下线
感觉这几个案例的表述就有问题,像以前做的语文挑语法错误的题。。。太过绝对了,有哪个产品经理会这么草率这么绝对的去做一个决策,肯定是要结合当下的各种情况各种因素,有些时候甚至数据的确是不准的,但是短期能带来效益,那为什么不去做这个功能或者改变这个功能?不过讲逻辑是必要的,不要被数据欺骗是真的——个人看法哈
由果推因是因为默认分析问题有逻辑关系,不准确是因为没有发现最全面的逻辑分析导致判断有误差。尊重但不能完全依赖数据。
第一个例子不是很合适。因为很多未明确的隐藏设定限制了对问题的考虑,比如平台商品的总量、推荐位的限制等。
虽然从问题的逻辑来看,把A推荐给非甲类用户购买概率达到91%,远远超过了甲类用户购买的45%。但并不等于我不会推荐给甲类用户,难道推荐位有且只有1个,而且我只有一次推荐的机会么?
从绝对值上说,甲类用户的购买量占到总量的89%,单A产品的销量也是非甲用户的4倍。站在产品的角度,说明甲类用户就是核心用户,多挖掘一下是有很大的概率获得更大的收益的。不是么?
不要轻易下结论,产品经理要多思考。
整体说来,问题是分析的纬度不够,分析对比应该既有横向分析也有纵向解剖
在我看来是针对当前产品思维维度不够多!!产品经理需要的是合适的产品思维。维度不足就需要会利用工具补足。
这个逻辑是非常好的,是一个事物发生原因和结果的正反认知,还有一种数据陷阱,数据在十分钟之内突然忽高忽低,什么情况,请帮忙分析一下
那要看是什么类型的数据变化了,是周期性的,还是突发性的。如果是周期性的,还好理解。如果是突发性的,那要分析的因素就太多了,先排除硬件、行业波动、以及政策,人为等因素外,由产品设计缺陷或是商品自身属性的问题就有太多的可能。。