我们应该如何选择定性研究的样本?

0 评论 1752 浏览 0 收藏 9 分钟

在做用户研究时,定性和定量是常用的两种方式。而在定性研究里,选择样本是一个许多人都困扰的问题。这篇文章,我们来分析下这个问题。

如何选择定性研究的样本是一个许多人都感到困扰的问题。在工作中,定性研究结果也更容易受到其他人的挑战,比如“你们的研究结果到底有没有代表性?”、“样本量为什么这么少?”、“你们的样本是怎么挑选的?“等等。这些问题很常见,但确实不容易回答。因为即使在学术界,这些质疑也一直伴随着定性研究的发展。许多著名的专家学者都对这些问题提出过自己的看法。我来给大家当下搬运工,尽量简明地提供给大家一些解答。

上面提到的其实是3个问题。第一、定性研究的代表性如何?第二、定性研究需要多大的样本量?第三、我们在实际工作中应该如何确定定性研究的样本?以下逐一说明。

一、定性研究的代表性如何?

这个问题的直接回答是:统计意义上,定性研究没有代表性。从研究方法上来说,定性解决的不是定量问题。它也不能被用定量的标准来衡量。统计意义上的代表性是指挑选出来的样本在统计指标上可以反映总体的特征。通过对抽样样本进行统计、分析,可以在一定置信区间下推断总体的行为、态度或其他特征。能推断总体的定量研究需要严格设定抽样样本框,并以随机抽样的方式抽取足量的样本来保证抽样样本能反映总体。而定性研究的样本挑选在以上3个方面的条件都不满足。按定量研究的条件去抽取定性研究样本注定是徒劳的,定性研究不能在统计意义上代表或推断总体。

那么,我们进行定性研究的意义是什么呢?

比较常见的是,定性研究可以用来探明某个问题的成分。举一个例子来说,数年前我给某个净水器品牌进行市场进入前的研究。这项研究需要了解大家对于饮用水的态度是什么。定性研究比较适合于探索中国人喝什么样的水、如何喝水、以及为什么这样喝。比如有些人会认为水一定要烧开才能喝、有些人认为不能喝纯净水、还有些被保健产品洗脑的认为要喝离子水之类。如果没有前期的定性研究,研究人员很难穷举所有的态度、行为、原因等,直接定量可能会遗漏某些重要的因素,或者因为没有足够走近消费者而不熟悉他们的语言,从而降低定量的有效性。而定量可以帮助研究人员进一步按态度与生活方式进行群体细分,回答各群体所接受的主要态度是什么,排斥的态度是什么、数量有多大、彼此之间是什么关系,从而在营销上确定主要目标群体和沟通方向。总而言之,用定性确定某问题的成分是什么,然后用定量来回答结构,诸如哪个成分多哪个成分少?某群体在接受某成分的同时是否排斥另外一个成分,排斥的力度有多大等等。

定性研究的另一种用法是重现故事和还原场景细节。定量研究并不是叙述性的方式,它不可避免地会损失许多细节。而且定量通过统计来反映问题,许多貌似琐碎和不稳定的因素往往容易被忽视。而定性可以深入讨论所发生行为的前因后果,态度的形成过程,某个场景下所包含的细节因素。这些可以加深研究人员对用户特征和场景的深入理解,重塑产品或营销的故事主线。创作人员也可以从受访者的细节描述中体察用户的情感表达,为产品或营销方案的产生获取洞察与灵感。

因此,虽然定性研究在统计意义上没有代表性,但并不意味着定性研究没有意义,而是要以适合的方式来使用定性研究。况且,任何个案都拥有群体的共性。通过对多个个案研究结果的对比,平衡好个性与共性间的关系,定性研究也可以在一定程度上说明群体问题。

二、定性研究需要多少样本?

理论上这个问题也没有答案。因为定性研究选取样本的逻辑是达到信息饱和为止,所以学术上,定性研究的样本量是做完研究后才知道的。还是拿上面饮用水的例子来说,如果研究人员第一个访问的是某个老年人,他会提到他只烧自来水喝,出门自己带杯子带水。不买瓶装水喝,也不信任楼下水站小伙子卖的水。那么研究人员接下来需要去找小区水站的工作人员,询问来这儿买水的都是些什么人。然后再去找来水站买水的人了解他们的想法。然后不断继续,一直到各个方面了解到的信息达到饱和为止。所以定性研究的样本量可能是1个,也可能是许多个。说到这里,大家该问了,这样的话没法写计划书,也不符合申请公司预算的流程啊。

那么,具体应该怎么做呢?

答案是在定性研究之前,先通过桌面研究、市场数据、过往经验或其它方式进行预研究。在定性研究之前,根据一些相对重要的指标设定样本条件,保证主要的受访对象不遗漏。但需要说明的是,这些指标的设定与定量中的配额并不是一个概念。如果定量里设定了100个50-60岁的人,总体而言,他们会呈现出不喜欢看二次元漫画的特征。但如果定性访问中,3个50-60岁的人,有1个受访者说他喜欢看二次元漫画。那么这个样本有效吗?回答是这是可以接受的,因为定性样本可以不反映总体的特征。但研究人员也不可以据此得出50-60岁的人有33%喜欢二次元的推论。

这个样本的意义在于他说明50-60岁的人里也可能会喜欢二次元漫画及其原因。他的回答在多大程度上可用取决于研究目的和具体问题。如果对于这类个性与共性的关系没信心把握好,那么在每个同质化样本条件里设定3个以上的样本。同质化样本一般来说在3个之后信息的饱和程度就很高。如果在研究过程中发现前期设定的样本条件没有能很好地区分不同特点的样本,这个会相对棘手一点。如果前期样本量的设定还比较大,调整起来也会相对容易。如果样本量确实不够,仍然建议增加样本,不建议强行解释。

总体而言,定性研究遵循的并不是定量研究的逻辑。如果强行用定量研究的标准去衡量定性,是不合理也是不恰当的。对于研究人员来说,与其强行去解释定性研究的代表性,不如更合理地使用定性。

本文由 @Gump 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!