【干货】从网易产品经理笔试,教你如何做数据估算题
2016年网易产品实习中,有这么一道数据估算题:
估算今年全国通过网络参加考研培训的人数?
这类题型主要考察:
- 逻辑思维能力:遇到问题能否清晰有条理。
- 数据能力:对数据的关注度,是否重视日常的数据。
- 细节把握能力:是否注意分析中的细节,结合实际情况去细化
要点:
- 准确的数据越多,估算越有根据,也体现了应聘者对数据的重视。
- 漏斗模型,注意每个环节的人员流失率。环节考虑的越多,对问题的分析也更加透彻。
- 用户分类和画像。尽量结合用户的使用场景,对用户进行分类,这样数据也更贴合实际情况。
- 思路比结果重要。最终的数据可能不在一个级别,但是在有多种方案的情况下,通过不同方案的比较大致可以估算出一个量级。考察的重点是思维。
本题解答思路(供参考):
步骤1:做加法
(本阶段不求正确,多多益善)
寻找准确能够获得的数据,从不同维度来寻找数据,类似头脑风暴:
1. 提取关键字法:
可以通过去掉其中的一些形容词,提取关键字来联想
全国+考研:今年全国考研人数
网络+培训:今年全国网络培训机构数,机构收入数,培训人数
2. 从人、地点、时间、钱几个维度来寻找线索。
- 人:考研的人数,培训老师的人数
- 地点:高校数,机构数
- 钱:在线教育交易额,客单价。
3. 从提供端和需求端两个维度
提供端考虑:机构数,机构老师数。需求端:课程数,学生数。
步骤2:做减法
从步骤1提取自己较为熟悉的数据且和目标数据相关度更明显的数据。目标事件为考研培训,直接参与的主体是教师和学生,我们不妨通过教师数目和学生数目来突破。
步骤3:方案分析
本例提取考研学生报名数:170万,大学教师数150万
3.1 由培训教师来计算
考研科目的培训主要集中在外语,数学,政治等科目。
英语教师、数学教师、政治教师累计占比:
一本院校:
计130所,平均每个学校英语(含小语种)教师60名,数学教师(基础数学)按50人计,政治教师按40人计。每个老师平均按30个学生计,可以带学生,考虑到学生实际可能一个人报3门课,平均每人按报1.5门课计。平均每一百个老师有3个做培训。
得到:130x(60+50+40)x30x3%/1.5=1.17w
二本院校:
750所,平均每个学院英语老师(含小语种)教师35人,政治教师30名,数学教师计30人,每个老师平均按20个学生计(教师影响力认为比一类院校差),可以带学生,考虑到学生实际可能一个人报3门课,平均每人按报2门课计(认为二本院校学生培训需求相对较强)。平均每一百个老师有5个做培训(认为二本院校教师时间相对充裕)。
得到:750x(35+30+20)x20x5%/2=3.18w
方案2合计:1.17w+3.18w=4.35w
3.2 由考研学生来计算
按大学来分:一本院校研学生占总考研人数比50%,由于资源相对较多,集中在线下培训,其中参加线上考研培训的比例按1%计,二本院校考研人数占总考研人数比按40%计算,参加线上考研培训占考研人数的比例按3%计算,三本考研人数较少占总考研人数比计10%,参加线上培训的占考研人数比例计2%。
计算结果:170w x(0.5×0.01+0.40×0.03+0.10×0.02)=3.23w
步骤三 计算过程中的要点
要点1:漏斗模型:
每经过一个环节,数据都会打折,留存的百分比直接相乘得到结果。
方案1漏斗模型:
在顶端数据确定的情况下,漏斗本身实际存在的环节越多最终的误差越大,分析时选择的环节越多,数据越接近真实数据。最终的结果为漏斗底部数据乘以各个环节的留存百分比。
要点2:通过用户画像对用户进行细分。
根据学生考研院校的不同,分为一类本科和二类本科,根据教师所教的课程不同对教师进行分类。分类原因是因为这些不同的用户在不同的漏斗环节具有不同的流失率,有利于数据更加准确。本例在答题时间充裕以及对考研情况非常了解的情况下,学生可以继续细分为不同专业的学生,不同收入水平的学生,对于政治教师可以继续根据教师的方向分类,例如和考研相关的马克思主义理论教师从事培训的比例相对较高,可以和其他方向分开计算。甚至可以根据年龄进行细分,有经验的较年长的老师可能参加培训的比例更高等。
步骤四:交叉验证
本例中两种计算方案最终数据大致相当,得到了一定的验证。
总结
主要的思路和流程如上图:以上简要介绍了产品笔试面试中常遇到的估算题。最终的数据不一定可靠,但是思路是大致一样的。功夫在平时,我们只有多关注数据,平时有意识对用户进行细分,才能更好的锻炼思维。
作者:孙辉(微信号huihuishengwei),在校研究生,产品爱好者,创业团队产品经理
本文由 @孙辉 原创发布于人人都是产品经理。未经许可,禁止转载。
你这思路有问题,人家问的是参加网络培训
170万是16年考研人数,首先应该是考虑参加培训的人数占比吧(有一部分是完全自学的,属于流失),再才是用户细分,然后考虑线下培训与网络培训各自占比,,,一点个人想法
看完题目,我想我是不是要转行。
我有一个问题:3.2中,170万是学生总人数,(0.5×0.01+0.40×0.03+0.10×0.02)中,0.5、0.4、0.1分别是一本、二本、三本中考研的人数百分比,但是括号中并没有一本、二本、三本占总考研人数的百分比~
170万是16年考研报名人数,你去查一下就知道了
补充一下:刚刚的疑问针对3.1方法
我也发现这个没体现出网络这个关键词呀,不过作者的思路还是值得借鉴的
写的挺好的,有个疑问,你这里是不是没加入“网络”这个关键词啊?不是问通过网络参加考研培训的人数吗?
是的。。。所以感觉有点虚?
这写的有问题
个人的思路:先得出16年本科毕业人数、考研人数。假设本科毕业人数为76w,考研人数为170w(网上找到的数据)。得出平均100个毕业生有20个考研的比率。通过市场调查随机20个考研生的网络培训比例(可以调查2、3组,建立角色画像)。假设3组20个研究生的线上培训平均为65%(用户画像进行分类,这里可以对城市不同进行细节分类),那么大概可以估算170w考研学生有大概110w个参加网络考研培训。不知是否正确。
100个毕业生20个考研的,这咋得出来的?除了应届考研,还有往届的(二战三战…N战的)、社会人士考研的。
笔试完看见这个,哎,早看到会好很多
思路开拓了不少,满满干货!
看完题目一脸蒙蔽,后天就要笔试了,有没有大神可以线上指导
类似的题目还有估算一个城市的出租车公交车数量啦,估算全国打某个游戏的用户总数啦之类的都可以纳入到答主的这个解决体系里面来。概括一下答主的思路大概就是细化问题+层层抽样,从一个部分来估算整体,分了几层之后做抽样调查比整体就快捷多了。
思路挺好的,估计实际操作中需要比较准确的用户调研。 🙂
费米推理法。作者思路方向绝对是很棒的,不过那些各科目教师参与培训比率和学生平均报1.5门科目这些数据的获取确实缺少调研,来自于经验吧,需要进一步论证,或者换个方向。
我最后做这个题的时候只有十分钟,写了5行左右就没有时间了,也没有写完。我当时是想从宏观层面,如历年的研究生报名人数,录取人数,网络用户占比等。但是这样的数据又没有办法查阅,所以如果自己去估计数据的话估计更加离谱。所以楼主的估算方法还是有不错的价值的
查查四年前和五年前的本科录取人数,得出一个增长率,再查查去年的考研人数,乘以增长率,就得出今年的考研人数了
你这个,随便一个数据估算错误,差距就大了。比如,平均每人按报1.5门课,这个数据确定?平均每一百个老师有5个做培训,凭什么?这种数据都是在YY啊,没有任何科学依据。而且,参加培训的人数,和培训教师的人数,也没关系吧!
是的,结果很不精确。培训教师的数目,是来作为量级参考的。
问题是几乎每一个参考系数都是YY的,何来自信量级能正确?
你们是脑子不好使吧?做校招笔试哪来的精确数据?出这种题考察的根本就不是你能不能精准的算的对,因为根本不可能有人算的对。别人是要考你在计算过程中每一步是不是符合逻辑,有没有把该剔除的去掉该保留的保留。最后得出的数据根本就不重要。这里一个阿猫一个qingtongli一直纠结数据准确性,是学数学学傻了?
这个思路不敢苟同
你这个整的太复杂了,一上来哪有这么多时间,其实这里面只需要关注2014年,2015年的4个数据就行了。分别是2014、2015年的在大学本科毕业生的总人数,参加考研的人数,录取人数,参加网络培训的总人数(发放一份调研问卷,调研一下已经考上研究生的同学,他们有多少人参加的网络培训,得到一个百分比)。通过2104,2015本科毕业生的总人数,参加考研的人数,录取人数,参加网络培训的总人数这四组数据,分别得到四个百分比,得到他们之间的一个关系,然后查阅一下2016年将要毕业的大学本科毕业有多少人,通过2014年,2015年的比较数据就能比较精确的得到2016年大概会有多少同学会参加网络在线培训。说说你分析的问题,大学教师的多少和考研人数的多少没得半毛钱关系,一个班50人也是教,40人也是教。你所说的占比1%,2%的依据是什么,数据可靠吗?你怎么去统计这部分数据,所以你这里面没有考虑数据统计的正确性,既然这样的话,你得到的数据的可靠性就会很差,说白了,一堆很水的数据。所以结论就是好木匠不一定要用尺子,好司机开车的时候不是还要背交通法规。
谢谢关注。1%是根据个人经验,是没有依据。你说的方法挺好的,可是可能没有往年的网络在线考研培训数据。
不明白层主说的四个百分比得出他们之间的关系是什么意思。
——还有实际上是调研前三年的数据。不仅要算增长率来推算数值。还要考虑增长率变化值。
层主你这个直接拿到往年参加网络培训的总人数就是开启作弊模式了好嘛。。。这样的话直接比例就出来了,不符合这道题的初衷了吧。
➡ ➡ 最后做这题的时候只有3分钟了 😥
时间规划和进度控制也是产品人重要的能力,拿到题目后可以大致估算一下每个题花的时间,控制好节奏。 😀
完全没答对,主要是时间根本不够 😥 😕 😥
没有标准答案,主要是思路。 😀