完全基于个人理解的海外产品运营-上线测试
本文将深入探讨如何进行有效的上线测试,确保每一步都为最终的产品成功贡献力量。继续阅读,了解测试的核心指标、围栏指标以及三种主要的测试方法,让你的产品在竞争激烈的市场中脱颖而出。
有了一个自己能够灵活使用的体系之后,接下来需要考虑的问题就是如何上线测试了,测试的方法看上去很复杂,其实只要理解了核心,理顺了思路,测试,易如反掌。
01 核心指标和围栏指标
首先,测试重点在于要测什么,要测的这一项,就是本次测试的“核心指标”,在测试中要特别注意控制核心指标的数量,一次测试中原则上只有一个核心指标,但实际操作中在特殊情况下允许灵活变通。
比如当一个版本中同时修改了数据备份和磁盘格式化,在两个点关联度很低,可以在同一个版本中作为分别两个不同的核心指标来记录数据波动情况,并结合后续的数据进行分析。
核心指标的表现往往决定了本次测试的成功与否,它的数据波动也反应了本次修改带给用户实际的感受以及对产品最终的影响。
产品上的一个修改影响的往往不只修改点本身,这样就需要关注更多的次级指标,也就是“围栏指标”。
虽然不鼓励这样做,但在测试的时候确实可以直接将产品最终的收益情况,如转化率或者平均用户价值,作为围栏指标。每次测试中可以有多个围栏指标,它们可能是与核心指标密切相关的,也可能仅仅是因为在产品中有着重要的地位。
围栏指标一般并不能直接反应测试结果,但它们对于数据异常记录,或核心指标波动的说明以及数据支撑方面都是必要的存在。
02 测试方法
确定好了测试测什么之后,就要看具体怎么测了,目前在工作中比较常用的有三种测试方法。
1. 直接上线,前后对比
对于中小规模的产品来说,这种方法可能是最常用的,在日常工作中,使用这种方式往往是因为进行测试的这个产品样本量有限或者本次测试的重要程度较低。
因为如何严谨的按照A/B对比测试进行的话,这些产品所需要的测试时间可能往往会在几个月甚至几年,这在实际工作中是不现实的。但这种测试得到的结果其准确程度并不是百分百确定的,因为时间段的不同意味着除了产品本身,很有可能存在着其它的变量。
举个例子:在圣诞节或者大型促销季时进行前后时间段对比测试的话,一般来说意义就不大了,因为随着促销季的到来,用户的转化意愿和转化能力都有可能出现非常大的变化,这期间的数据波动很有可能并不是产品变化引起的或者数据波动的主要原因并不是产品的变化。
因此,如果使用直接上线,前后对比的方式进行测试,首先要确定这个时间段能不能测试,然后要控制好时间和变量,要收集到足够的样本量才能进行计算,避免偶发情况;其次,在测试结束后,仍然需要在一定时间内继续对数据进行跟踪,确认测试结果。
2. A/B对比测试
A/B对比测试相对来说是一种更准确的测试方式,即在同一时间分别上线A和B两个版本,将用户按照1:1的比例随机分配给两个版本,然后观察A和B两个版本分别的表现情况。
这种测试方式对参与测试的样本量是有一定要求的,因为要将所有参与测试的样本平均分成两份,如果数据量较小的情况下仍然A/B,很有可能导致测试过程中出现过多的偶发情况;一般来说样本量越大,测试的结果也就越准确。
在测试前我们可以在专业网站(比如evanmiller.org)上先计算一下所需的样本量,以此为参考,再对自己需要样本量做到心中有数。即使我们无法完全达到需要的样本量也没有关系,因为可以根据核心指标的表现情况,结合围栏指标共同进行判断。
3. 灰度测试
在担心本次修改会对用户或市场造成较大的冲击,无法确定用户或市场反应时,灰度发布是一个不错的选择。灰度发布的重点在于如何控制上线节奏,把握用户比例。一般情况下不提倡边走边看,最好是先设定时间段,比如首先计划好第一周上线30%,第二周提升至上线50%,第三周70%,第四周100%,在比例调整前要注意观察数据,为比例调整提供充足的判断依据。
这种测试方式比较特别,如果可以的话,在测试期间需要特别注意收集用户反馈和评价的变化,可以是被动地等待用户提交反馈,也可以主动地向用户询问意见和建议,然后再根据数据波动和反馈情况,看是否需要进行调整。
03 测试结果
总的来说,测试结果一般有以下几种:
- 若核心指标与围栏指标皆为正向,且超出预期,则说明需要进行预期管理优化;
- 若核心指标与围栏指标皆为正向,且符合预期,则说明该项目具有实际价值和意义,开启复盘梳理上线流程,可以推广至其它产品分别进行测试;
- 若核心指标与围栏指标表现不一致,测试结果存在异常,则需要详细分析数据情况,如果确有异常,需要找出异常点,进行调整并重新测试,如果是其它原因,也需要对其进行具体分析和调整。
- 若核心指标与围栏指标,或皆为负向,则需要考察具体原因,确定后考虑继续推进或调整重测或放弃测试进行回滚。
04 特别注意事项
产品测试的坑还是挺多的,这里列出比较重要的几个点,需要特别注意。
1. 上线验证
一定一定一定要确认,是不是真的上线了。这一点特别重要!
2. 数据跟踪
在测试前就要做好相关的信息收集和事件埋点工作,只有数据跟踪准备充足,拿到了数据,才能得出一个准确的测试结果。
3. 修改点的控制
并不是所有的修改都要进行测试,也并不是一次测试就要把所有的点全修改了拿过来测。一般情况下,修改的点越少,测试的结果越准确。
如果一次修改中修改了几个相互关联的点,那么在测试的数据分析中需要格外的慎重,不可轻易下结论。
4. 效果不好怎么办
上线之前要给测试“留后路”,要提前准备好撤回或者回退的机制。不过,这并不是说有一点风吹草动就要取消测试了,每次测试尽量观测完整的周期,这个周期长度需要在测试前就确认好,可以是一周或者两周。
产品运营的主体阶段基本就已经结束了,剩下最后的内容就是复盘了,下一篇具体说明一下,产品运营方案上线之后的复盘工作。
作者:吴桐,公众号:二喵的蠢奴才
本文由 @吴桐 原创发布于人人都是产品经理。未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!