调研复盘:以统计学为基础,我对在线教育平台做了一次调查
本文是一次调研复盘,作者对自己公司的在线教育平台做了一项深度研究,对平台用户的购课率、影响用户购买在线课程的因素做了一次深入的调查和梳理,过程种设计到非常有价值的统计调研知识,与大家分享。
前段时间笔者对自己公司的在线教育平台做了一项深度研究,主要方向是探究影响用户购买在线课程有哪些因素,以及这些因素的影响程度如何,希望以此结果指导平台的运营方向。
这篇研究我花了几个月的时间,采用了以统计学为基础的商业研究方法,最后的研究成果也写成了一篇论文。这里简单给大家分享一下核心的内容。
本次调研分为三步:
- 通过问卷调研收集信息;
- 通过数据分析出哪些因素会影响用户的购买;
- 通过分析结果能给运营策略带来哪些指导和改进。
下面将对每个环节进行详细叙述:
一、 通过问卷调研收集信息
在问卷设计阶段,根据前人理论研究+运营经验总结+用户深度访谈,最终建立了一个简单的模型,提出了8个有可能影响用户购买课程的假设因素,包括:
- 感知有用性——用户对学习课程产生效果的预判;
- 感知信任——对平台和老师的信任程度是否影响;
- 感知成本——课程定价是否有影响;
- 感知风险——风险因素:比如买了没时间听课之类会浪费;
- 社会影响 ——广告和媒体宣传、朋友推荐等;
- 使用习惯——有没有用过在线课程类似产品,有没有知识付费习惯;
- 时间匹配——线上课程时间与在校时间是否冲突;
- 内容质量 ——课程内容设计和课程质量。
每个假设影响因素我设计了3-5道题目,最终形成一共有39道选择题的用户问卷。
关于问卷设计体系我在之前一篇文章里写过,这里就不再复述了,有兴趣的可以去另一篇文章里面看:《如何设计在线教育用户调研问卷?借助消费行为学理论》
问卷设计好之后,通过我们产品的APP、微信公众号等渠道投放,最终收集了637份问卷。经过数据清洗,最终从回收的637份答卷中,共获得有效数据样本536份。
接下来,我们就要开始对回收问卷的数据进行分析了。分析之前,我们需要先思考一下本次研究的目的。我们需要通过问卷和数据分析来解决以下三个问题:
- 这些假设因素哪些有影响?哪些没影响?
- 有影响的因素,哪些影响程度更高?
- 不同画像的用户对这些因素影响有什么差异?
二、通过SPSS数据分析验证假设因素影响的有效性和程度
首先对问卷的第一部分进行描述性统计分析,大概了解这次调研的用户画像是怎样分布的?最终统计分析如下:
在本次526份样本数据中,从未购买过在线课程的人数、购买过低价体验课的用户、与购买过正价课的用户比例为10:6:5,与我们平台的用户购买数据总体结构接近;样本中初中生、高中生、初中生家长、高中生家长四个角色用户占比分别为:39.0%、32.8%、3%、25.2%,也与平台总体用户画像结构接近(初中生家长人数略少)。
说明本次样本结构比较接近总体的结构,能证明样本的代表性误差较小,调查准确性高。
接下来,用SPSS软件对问卷的第二部分先进行数据的探索性因子分析和信度效度分析,来检验问卷数据的可靠性,并可以根据分析结果合并一些假设因素。
然后再用多元回归分析,来检测几个假设影响因素的显著性。由于篇幅原因,我这里不对分析过程详细讲解,只说一下结果:通过因子分析,最终把8个假设因素合并为7个,其中“感知有用性”和“感知信任”合并为“感知价值”。
通过SPSS的多元回归分析,最后7个影响因素的显著性数据如下:
以上结果显示, 真正有影响的因素只有3个:
- 感知价值(课程效果预判+用户对平台和老师的信任)
- 社会影响(广告媒体宣传+同学朋友口碑推荐)
- 内容质量(课程设计和课程质量)
这3个因素对用户购买在线课程意愿影响显著,且这三个影响因素的Beta值分别为感知价值0.215、社会影响0.157、内容质量0.334。
可知影响程度由强到弱依次为:内容质量>感知价值>社会影响。
而感知成本、感知风险、用户习惯、时间匹配四个因素对用户购买在线课程意愿影响并不显著。
这个结果一开始有点出乎我们的意料,但我们初步分析后认为也是合理的:用户其实对我们课程的定价并不敏感,由于我们平台在线课程的价格相对于线下补习班和其他竞品相比,价格是比较低的,家长和学生所付出的成本相对较低,因此课程定价,在提升购买率层面不用太过于纠结;
对风险因素,因为在线课程产品使用方便、价格低廉、投入时间灵活、可以随时随地收听或关闭,因此无论是从对比成本还是效果收获上,用户普遍没有什么风险,因此风险因素也可以不考虑。
对于时间因素,虽然在线课程都是直播课,但是如果没时间看直播也可以看回放,很多用户在时间无法匹配却又想购买课程的情况下,依然会选择购买在线课程。因此课程排期的具体时间也不用做太多运营调整。
那我们接下来要重点说说,已经验证出的三个有效影响因素,在运营策略上应该如何改进。
三、运营指导建议
指导建议不仅要根据数据分析结果,更要对标自己平台现有的长短板,结合现有问题一起讨论运营改进策略。
1. 感知价值的运营改进
(1)通过课程策划包装提升用户价值感知
在用户购买课程前,让用户最直观感知课程价值——是课程的包装。包括课程的主题、课详页文案和视觉,均应更加重视用户对课程有用性和信任的感知。
例如,从课程主题策划上,平台现有课程的策划较为传统,与线下教学类似。可以针对用户对在线课程轻巧灵活的特点,将课程主题策划的更加精致,避免一个课程想讲的内容过多。
每节课一定要解决一个问题,并在课程标题中让用户感受到通过购买一节课程,能够解决这个问题或学习到一个知识点,提升用户对该节课的价值感知;
(2)提升用户对授课老师专业度的认可
用户对平台在线课程的价值感知也体现在授课老师的认可,可以从以下两个方面进行操作:
首先对全职老师增加培训及考评机制,促使授课老师提升内在专业性;对兼职邀请老师提升其学历背景、教学经历、知名度等门槛;
其次在课程页面设计上,尽可能多的展示授课教师的专业性,增加老师头衔,背景介绍,个人特色,成功案例等。
(3)关注用户效果反馈,包装成功案例
跟踪学生在听课后的成绩是否有提升。比如对听课后成绩得到大幅度提升,或中高考中取得好成绩的用户,打造成案例,展示给更多用户看,提升用户对课程的价值感知。
2. 内容质量的运营改进
(1)打造课程体系专业性和特色
专业的课程体系能帮助学生系统的学习知识,将知识点关联,举一反三,有效提升学习效果。并呈现给用户,因此设置一套符合线上课程特色的课程体系,并全面展示给用户,能够有效提高用户对在线课程的内容质量感知。
传统学校的教学经过教研工作者常年研究积累,已有非常完整的教学课程体系。但是线上课程由于网络教学松散、灵活的特点,普遍缺乏较为严谨的课程体系。
因此课程体系和课程设计上,教研团队应该更多研究线上教学的特点,比如加入数据统计和分析,深入开发线上用户和线上教研的课程。
(2)提升课程内容质量监管
本研究的结论表示,在线课程的内容质量,对用户的购买意愿影响显著。因此,在课程内容的设计和质量的把控上,需要管理上进一步提升,可以借助数据考核:比如出勤率、完课率、作业完成率等多维数据分析,综合评价老师的课程质量。
在内容质量监管方面,结合目前市场上其他平台的在线课程产品现状,确实存在内容质量良莠不齐,宣传与实际内容反差较大的情况。因为在线课程这类虚拟产品的内容质量概念相对于实物产品较为抽象,目前行业也没有统一的质量标准。
因此,想长久发展的平台,更应结合实际管理经验和数据分析,拟定一套内部内容质量管理体系,确保在线课程这种虚拟商品也有较好的内容质量监管方式。
3. 提升社会影响的运营策略
本研究的结论表明,社会影响对用户购买意愿有显著的正向影响。在管理上结合实际情况,在课程运营推广方面给出以下三点管理建议:
(1)巧妙借力学校和老师
出于权威性和信任感,老师和学校对学生的社会影响至关重要。因此,平台线上课程产品如果能深入学校,建立与校方的合作,通过学校和老师推荐课程,让学生使用和购买在线课程是非常完美的方案。
但在实际操作中,因为监管严格,学校对补课等话题非常敏感,一般不会同意直接推荐。但可以曲线救国,比如结合学校自身需求,策划为学校定制的免费公益课,促使学生免费体验线上课程产品。再进一步通过其他线上运营策略,让用户进行转化。
(2)策划运营活动,促进学生和家长间的相互传播
社会影响中也包含同学之间的相互影响和家长之间的相互影响,提升社会影响对用户的影响,可以从促进学生和家长间的传播为主要目的,策划线上活动,如利用微信、H5活动等进行拼团购买在线课程、推荐同学购买课程送代金券等活动。
目的使用户影响身边的同学一起购买在线课程,通过提升社会影响因素的作用,进一步提高用户购买意愿。
(3)选择合适的媒体和广告宣传
本研究的已经论证社会影响因素对用户购买意愿有显著影响。在本次测量题项中,社会影响包含了媒体和广告投放等环境影响。而我们的平台由于专注做好口碑,以前甚少进行广告投放。
因此本次研究后建议,可以提升媒体宣传投放的规划和预算,进行精准投放,提高社会影响因素对用户购买在线课程的影响。
总结
借助统计学和商业研究分析方法得出的调研结果,相对更科学和严谨,可以避免凭经验和拍脑袋得出的结论出现的误差。
但其实类似的分析可以有更深入的延展:例如还可以分析这几个因素的影响,对不同画像下的用户,会有什么不同?
更深度的分析,可以对用户进行更加精准的分层运营,由于篇幅原因本文不做更多赘述,有兴趣的下篇再更新分层运营用户的数据分析方法。
本文由 @路易丝 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
好奇得出显著性结果之前,有做过F检验,R方以及共线性检验吗
这篇文章很赞,让我了解到了统计学对调研的一部分重要性,用科学的方法。之后是要学习一下统计学方面的知识了。
有一个问题没太明白:
既然是做了回归,那么因变量的数据是如何得到的呢?
也就是说,所谓的“用户购买在线课程的意向”是怎么得到数据的?
如果是通过问卷收集到的,那么就会有下一个问题:能够有意愿做问卷的人,是不是本身就带有很强的购买意向?那么样本的代表性就会受到质疑。
如果是跟踪这些用户后来的购买行为,那么只会有两种结果:购买或者不购买,这样就成了分类问题而不是回归问题。
如果是通过某种算法算出来的,那这种算法是否涉及到了解释变量?
这个问题很棒,我回答一下。首先数据来源,是通过问卷收集到的,调查题项中最后一项是关于因变量“购买意愿”的4个问题。
其次关于样本代表性,由于我们这个平台的特殊性(核心业务是查分和成绩报告,还有很多其他的功能),而线上课程只是产品中的一个业务分支。问卷是通过平台上的广告位以及奖品等方式吸引用户填写,有意愿做问卷的人可以认为是平台的活跃用户,但与其是否有意愿购买课程没有直接关系。且从样本描述性分析中的“购买历史”能看出,有将近一半的用户从未购买过课程,即使购买过的用户中,使用深度也不一样。因此填写问卷的用户并非都有很强的购买意向。
您的分析思路真的很棒啊,有社群可以交流吗?
暂时没有社群哈,我公众号:1week
好的,谢谢
怎么数据清洗,是那些没有意义的数据不考虑进去吧?那没有意义的是不是答非所问类型?
对,简单的例子,你问他身高,他回你他吃了早饭。
收集来的问卷可以进行多种方法清洗,第一遍可以根据问卷星记录的作答时间,例如作答时间低于1分钟可以默认是胡乱写的,没经过思考的答卷可以作废;另外选项全部相同的也可以筛除(选项内可以设置一些反向题)
期待数据分析过程更详细的分享!!
测试