清明节,用数据思维案例聊聊平均死亡年龄和期望寿命
本文中,笔者将结合清明节聊一聊如何用数据思维分析“平均死亡年龄”和“期望寿命”。
前些天,我所在的一个产品经理群里面,无意中有人聊到了社保,继而聊到了关于中国人平均寿命的问题。问题如下:
中国现在对外公布的平均寿命,如:2018年平均寿命75岁,是一个名叫“期望寿命”的指标。
而中国人2018年的平均死亡年龄实际上只有66岁左右,所以群里有人认为,期望寿命是国家忽悠人一个指标,应该用平均死亡年龄来作为平均寿命的指标。
对此,你有什么看法呢?
中国人到底寿命多长,如果让你去收集数据然后得出结论,你会怎么做?
要知道平均寿命66岁和75岁,差别可是非常巨大的,会导致完全不同的舆论和国家政策。
群里面不少人随声附和,什么毒奶粉地沟油又被提起了,然而一个专业的产品群居然很少有人对上面的说法提出质疑。
看到大家的反应,我担心的倒不是中国人的平均寿命,而是担心产品经理的整体职业素质。
作为职业产品经理,平时都说自己根据数据分析来改进结果,这么多人对于这么明显的数据坑不能识别,那么得有多少决策是错误的?
在很多人看来,产品经理可能是一个门槛很低的职业,然而数据思维真的是很多人的硬伤。
数据思维不就是统计统计平均值,比比大小吗?
还真没有这么简单,有的看似很简单的问题,却藏着巨大的坑。
忽略掉基数,是很多时候数据分析的一个大坑,对认真学过统计的人,识别这个坑并不难,但是多数产品人员并不能,只会做简单点加减乘除求平均。
就像上面那个问题一样,如果想要计算一个国家人口的平均寿命,就把死亡年龄算个平均数不就OK了。
你要是不这么计算,他还说你把简单的事情复杂化。被“简单化思维”洗脑的人群其实也蛮可怕的,会变得有点反智。
这个世界上有的东西本质上就是不能简化的,过度简化就是错误。
一、平均死亡年龄
平均死亡年龄是一个很容易理解的指标,就是把当年所以死亡人口的年龄算平均。但这个具有误导性的统计指标,代表不了人群的平均寿命。
为了说明问题,我们来简化一下问题。假设有两个群体:
- 第一个群体:由十个10岁的人和五个70岁的人组成;
- 第二个群体:由五个10岁的人和十个70岁的人组成。
2018年,第一个群体中,10岁的人死亡2个,70岁的人死亡4个;第二个群体中,10岁的人死亡1个,70岁的人死亡8个。如下图所示:
算平均死亡年龄,第一个群体:50岁,第二个群体:63.3岁。
于是,有的人可能就想得出结论:第二个群体的人口比第一个群体人口人均寿命更长。
但是我们仔细看看:
这两个群体,10岁的死亡率都是20%,70岁死亡率都是80% 。刨除掉不同年龄阶段人口基数的误导,这两个群体的两个年龄阶段的死亡率是完全相同的,也就是说,这两个群体的人寿命应该是相同的。
然而,平均死亡年龄这个指标却相差很大,平均死亡年龄将不同基数混淆在里面了,没有任何的意义。
一个年轻人非常多的国家,只要年轻人意外死亡很小一部分比例,就能把平均死亡年龄拉的很低,造成大家寿命短的假象。而一个年轻人很少的老龄化的国家,平均死亡年龄就会被拉得很高。
中国当前就是中年、青年人口更多,所有平均死亡年龄会比较低。如果你用平均死亡年龄当寿命指标,就会被误导。
想要真正反映一个国家当前人口的健康及寿命的状况,需要刨除掉不同年龄人口基数的影响,要用到一个叫做期望寿命的指标。
期望寿命虽然叫“期望”,但并不是指的“期待”的意思,这个期望是“数学期望”,反应的是当下人真实寿命的,是刨除掉了基数影响的平均寿命。
二、期望寿命
为了刨除掉基数的影响,期望寿命的计算使用死亡率而不是死亡人数。
假设一个群体中年龄最大的是n岁,年龄最小的1岁。
假如在2018年,1岁人群的死亡率是A1(死亡率是一个百分数),2岁人群的死亡率是A2 , 3岁人群死亡率A3,以此类推,n岁人群死亡率 An。
那么人均预期寿命为:
1*A1 + 2*(1-A1)*A2 + 3*(1-A1)*(1-A2)*A3 + 4*(1-A1)*(1-A2)*(1-A3)*A4+….(直到n岁)
这个计算方法,是根据当年各个年龄阶段的死亡率来计算平均寿命的,直观感觉有点类似于有一个虚拟的人在同一年从出生到死去,平均会在多少岁死亡。
还有一种错误的理解,在一些网页新闻中能够见到。他们认为:2018年的期望寿命是2018出生的人预计能活到多少岁,这也是完全错误的。
期望寿命是当前人口刨除掉基数影响后寿命的数学期望值,不是对新生人口未来的预计。
三、总结
在做产品数据分析的时候,也有不少这样的问题。比如:有的人就直接把不同渠道的转化用户直接相加,或者把不同地区的转化用户相加等。
要知道这些数据的基数都是不一样的,很有可能会得出误导性的结论。
有的人说数据是不会骗人的,其实,数据是最会骗人的,数据思维不过关的更容易被数据欺骗。
数据思维也不是想某些文章讲的那样,有意识地去看看数据就是有数据思维了,那顶多称得上数据意识。
后续有机会还会继续分享数据思维相关的问题。
本文由 @ArvinNing 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
这么极端的例子算出来也就差十来岁。
你这个例子,到第二年第三年,逐渐的这两国的平均死亡年龄就趋于相等了
同为心理学硕士,能不能加个微信交流下啊?
事实上产品经理就是要学会思考生活。而且生活中的思路产品的思路是一样的,这个职业就是这样的,不喜欢嫌累可以尽早别干
感觉真的没必要分析,如果做这方面工作,那无可厚非,但是产品经理也是人,如果时时刻刻用工作的思维分析生活中的所有事情,那真的会累死的,至少我这种俗人做不到
我觉得反智说的就是你这样的人,只是一个例子而已工作中生活中都一样的道理
大一学的概率论又捡起来了 😉