数据分析系列误区(六):伯克森悖论
为什么发放了大量优惠券以后,购买行为会有一波猛增?这种伯克森悖论如何产生的?这篇文章,我们看看作者的分享。
最近直播间进行了一次年终回馈优惠券发放活动,由数据专员小A提供数据支撑。通过统计活动期间数据表现:有1200位用户有领取优惠券,并且有500位实现了成交;反观没领券的4000位客户,期间只有100位下单,下单率微乎其微。对此,小A的初步推断是,优惠券的效果堪称显著,使用优惠券后,下单率大幅提升。
然而,当我们探究更深一层,事实就变得不那么简单了。
为何这么说?直播间下单买家,他们可能本就有较强的购买意愿,这才导致他们更愿意领取优惠券。即使没有优惠券,他们也有可能会产生购买行为。因此,我们可能过度解读了优惠券对提高购买行为的作用,而忽略了这批用户本身可能就是更可能产生购买的高概率群体。
所以,尽管看起来领取优惠券的用户的购买行为大幅提升,造成了一种“领券行为仿佛魔力四溢、能够显著提升购买行为”的假象,但这可能并非真实情况。这正是伯克森悖论的一种表现。
为得出更准确的结论,我们需要深入理解用户的购买意愿,揭示不同用户群体之间的差异,控制潜在的混淆因素,径直观察优惠券本身对购买行为的影响。而对于那些没有领取优惠券的用户,我们也需要深入理解他们的用户行为,推断他们的购买意愿,这样我们才能得出更接近真实的结论,避免陷入伯克森悖论的误区。
在数据分析中,伯格森悖论通常反映在样本选择和分析方法上,下面列举几种常见场景:
一、市场调查场景
一家公司决定进行市场调查来了解消费者对其新产品的接受度。如果公司选择在其目标消费者群体中进行抽样调查,收集到的数据可能显示出很高的接受度。然而,如果公司选择在更广泛的消费者群体中进行抽样,结果可能就会大相径庭。这就是伯格森悖论:对于同一问题的不同采样方法可能会导致截然不同的结论。
二、医学研究场景
在进行医学研究时,研究人员可能试图了解某种治疗方法的效果。如果他们专注于已经接受该治疗且痊愈的病人的数据,他们可能确定该治疗方法非常有效。然而,如果他们同时考虑了接受该治疗但未痊愈的病人的数据,结论可能会产生重大的不同。这就是伯格森悖论的体现,再次提醒我们数据采样和分析方法的变化会对结果产生重大影响。
三、机器学习场景
在机器学习中,模型的质量常常通过准确率、召回率等指标评估。然而,如果模型在某个特定的类别中表现很好,但在其他类别中表现较差,那么模型的整体性能会受到影响。这也是伯格森悖论的一种体现,依赖于我们选择的评价方式,即使是同一个模型,也可能获得截然不同的评估结果。
这些例子都说明了伯格森悖论的核心观点:在进行决策或评估概率时,我们需要清楚定义问题的前提和假设。否则,由于问题的模糊性,我们可能会得出完全不同,甚至互相矛盾的结果。
总的来说,伯格森悖论告诫我们在使用数据分析时,必须非常明确我们的询问方式,抽样方法,和评估方式。否则,我们可能会得到违背我们预期的、或者互相矛盾的结果。
本文由 @佑佑和博博~ 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!