最大化A/B实验成效:这个方法绝对不能忽视

0 评论 869 浏览 3 收藏 18 分钟

想象一下,如果能预先知道哪些实验最成功,并将资源和精力集中于此,会对你的增长效能产生怎样的影响?本文将告诉你,如何利用ICE模型让你的每一次实验都能产生最大的效益。

ICE模型是一种对实验想法进行优先级排序的综合评估框架,其目的是帮助我们最大化实验效果。

ICE三个字母分别代表:影响力(Impact)、成功概率(Confidence)和易实施性(Ease)。

通过对每个实验想法从这三个维度进行打分,并综合得到总分,我们就可以对实验的优先级进行排序。

一、ICE模型定义

1. ICE模型定义媒体

(1)影响力

指的是实验成功后对关键指标的提升程度。主要考虑两个因素:实验覆盖的用户量以及实验能够将指标提升的幅度。

(2)成功概率

取决于是否有充分的数据洞察支持实验假设。数据来源可以是定量数据、定性数据或行业最佳实践等。

(3)易实施性

需要考虑上线实验需要投入的各项成本,如研发资源、设计资源、经济成本等。我们希望以最低的成本快速验证实验假设。

2. 通过ICE模型进行实验想法评分和排序

针对每个实验想法,从影响力、成功概率和易实施性三个维度打分,再综合得到总分。总分越高,代表实验想法的优先级越高,越值得优先执行。

要注意的是,在做增长实验想法优先级排序的过程中,不要去盲目的追求精确性。

因为 ICE模型或者其他的一些优先级排序的模型也好,都只是一个参考的框架,不是一个绝对的科学,不需要花太多的时间去追求每个打分的绝对的完美和科学,而是要把重点放在提高实验频率和数量上。

二、ICE模型应用案例分析

接下来我们通过一个案例,演示如何利用ICE模型对实验想法优先级进行排序。

1. 提升新用户预定成功率的实验想法

假设我们是一个订房网站,希望提升新用户预定房间的成功率,现有以下三个实验想法:

(1)微信一键登录功能的开发

我们发现很多新用户在注册环节就流失了,考虑开发微信一键登录功能以优化注册流程。

(2)页面上添加全网最低价保证

通过在页面上添加全网最低价的标语,降低用户对价格的顾虑,促进用户下单。

(3)为热门房源添加精选标签

对热门房源添加醒目的精选标签,吸引新用户点击和下单。这三个实验想法初看都有一定道理,但资源有限,我们需要决定先做哪个,后做哪个。此时就可以借助ICE模型来评估每个想法的优先级。

2. 订房网站实验想法的ICE评分

1)微信一键登录

高影响力、高成功概率、中等易实施性

影响力:9分

微信一键登录可以显著提升新用户的注册转化,覆盖几乎所有新用户,影响力很大。

成功概率:9分 wsc

微信登录已是主流APP标配,成功概率非常高。

易实施性:6分

开发微信登录需要一定的研发资源投入,易实施性中等。

ICE总分:24分

2)全网最低价保证

中等影响力、高成功概率、高易实施性

影响力:7分

全网最低价承诺可以直接影响用户下单决策,且如果展示在一些高流量页面比较明显的位置,那预期的影响会更大,但相比登录环节影响力略低。

成功概率:9分

价格优势承诺符合消费者心理,成功概率很高。

易实施性:8分

只需修改页面文案,易实施性非常高。

ICE总分:24分

(3)精选标签

中等影响力、中高成功概率、较高易实施性

影响力:6分

精选标签可以在一定程度上引导用户选择,但相比价格承诺,影响力稍弱。

成功概率:7分

竞品大多有此做法,但精选效果需要进一步验证,成功概率中等偏上。

易实施性:7分

技术实现不复杂,但需要一定的数据分析支持,易实施性较高。

ICE总分:20分

从ICE模型打分结果看,微信一键登录和全网最低价的综合得分最高,达到24分。精选标签得分相对较低,为20分。

综合考虑三个维度,全网最低价承诺无论在影响力、成功概率还是易实施性上都有不错的表现,各项指标均衡,非常值得尝试。

微信一键登录的影响力和成功概率虽然更高,但实施起来有一定难度。所以我们建议优先尝试全网最低价,其次是微信一键登录,最后是精选标签。

增长目标如同瞄准镜中的靶心,ICE模型可以帮你的AB实验更精准地命中靶心。

三、提升实验的预期影响

通过ICE模型,我们可以较为准确地估计每个实验想法的综合价值。但在实践中,我们往往会面临一个问题:绝大多数实验的影响力都不够大。

这主要是因为我们的关注点过于局限在最核心用户身上,而忽视了更大范围的用户群体。比如,一般来说活跃用户只占所有注册用户的 50% 甚至更低,而注册用户其实又是远远小于存在于外部渠道未注册人群的。

因此从这个角度来看,增长实验如果只关心在核心用户上的话,影响力是受到非常大的局限的。

1. 扩大实验的用户覆盖范围

那如何提升影响力?最重要的方法,就是是扩大实验的用户覆盖面,不仅要关注核心用户,更要把眼光放到更广泛的用户群体上。

核心用户虽然是产品的中流砥柱,但在整体用户中的占比往往不高。我们要主动将视角扩展到活跃用户、注册用户、过客用户,甚至尚未接触产品的潜在用户身上,积极为这些非核心用户策划有价值的实验项目。

比如Airbnb就开发了很多面向非房客用户的功能,如旅游攻略、社区论坛等,以扩大实验的触达面。

2. 利用高流量页面和路径进行多次实验

要想撬动更大的影响力,第二个方法就是锁定高流量页面和用户路径,在这些关键节点上反复实验,持续优化。因为这些位置聚集着大量用户,每一次小幅优化带来的效果提升都会被放大。

举例,咪咕视频为了提升APP下载量,针对下载页反复进行AB测试。最终,相比初始版本,优化后的页面点击率提升了56%。可见在高流量页面上,持之以恒的实验优化,往往能收获惊人的效果。

其实平时的工作中就可以有意识的去找各种关键路径,一般来说漏斗上游的路径,新用户注册激活的路径,购买转化的路径等等都是值得去做多轮实验反复提升的路径和页面。

四、提高实验的成功概率

ICE模型中的C代表成功概率,即实验达到预期效果的可能性。我们在设计实验时,一定要尽可能提高成功概率。而这需要扎实的数据洞察作为支撑。

回归到上一篇文章,讲的就是如何从数据中找到足够有力的洞察和支持,包括各类定量和定性的分析。

定量数据能揭示用户行为模式,定性数据如用户反馈则能还原用户心理。除此之外,竞品分析、行业报告等也能为实验假设提供有价值的参考。唯有将各类数据高度整合,才能真正洞察用户需求,找到最有可能成功的解决方案。

举例,如果我们想要测试是否延长订单支付的有效时间,可以提升订单支付成功率。

首先可以通过数据分析,观察不同支付时效下的订单支付转化情况。

其次可以收集用户反馈,了解他们对支付时限的看法。

最后再参考同行业优秀产品的做法,形成完整的决策依据。

五、降低实验的实施难度

除了影响力和成功概率,易实施性也是评估实验价值的重要指标。资源总是有限的,我们需要以最小的成本,最快地验证实验效果。最好的方法就是通过 MVP 的方式与最低成本去验证实验假设。

1. MVP(最小可行产品)策略的应用

MVP的核心思想是用最低成本快速开发原型,尽早与用户见面,通过获取用户反馈来验证产品假设,进而不断迭代优化。

这种策略也非常适用于增长实验的设计。设计增长实验 MVP 的时候,你要去考虑2个问题:

1)如何用最小资源快速验证假设

如果实验假设可以仅通过数据分析就证明或者证伪,那这个其实也是增长实验的MVP,你甚至不需要去开发这个实验,只是通过数据就证明或者证伪了,这也是非常好的结果。

如果无法通过数据分析直接验证,是否有可能不用做完整的版本,而是开发一个小版本,就足以验证假设是对的还是错的?

2) MVP实验是否能提供可信的决策参考

我们需要的是有效的结果和洞察,所以不能把实验的版本过分简化,导致最终的结论不完整,无法证实或证伪实验想法,那这就不是一个可信的增长实验MVP。

2. 个人化注册流程的MVP设计案例

实验假设是不同的用户画像需求不同,需要设计个人化的流程可以更好地满足需求,提升成功注册转化率。

针对这样的实验假设, 如果贸然开发一整套个性化方案,会发现工程资源投入、设计资源投入、数据资源投入都是非常高的,那增长实验的容易程度的得分就会非常低。

所以,不妨想办法把它转化成一个轻量级MVP。比如只选 25 岁左右的女性,只针对这种人群来做个人化的注册流程, 然后对该人群进行小流量AB测试,验证效果。

如此一来实验资源投入会大大降低,如果提升明显,再扩大实验规模。

3. 无限滚屏功能的反面案例

艾奇是美国的一家创意手工电商平台,他们的产品团队花了半年时间开发出了无限滚屏功能,上线后发现各项指标非但没有提升,反而出现下降。整个团队灰心丧气,最终只能回滚到老版本。

再来一次的话,他们应该怎么做呢?其实可以通过 MVP 方案测试,比如将原本只展示 50 个商品的页面,变成展示 100 个,通过这样的方式去验证是不是更多的商品能够提升用户的购买转化。

所以,更高效的做法是:先小范围试错,观察数据表现,成功后再迭代,而不是一口气追求完美 。

从0到1快速验证,从1到100再反复打磨,这是一条极大提升实验成功概率和投入产出比的有效途径。

4. Facebook通过MVP快速验证实验假设

事实上,很多优秀的产品在实验设计上已经形成了一套成熟的方法论。以Facebook的增长实验流程为例,从想法提出到正式上线,每个阶段都经过了缜密的数据验证:

  1. 通过各类分析初步验证想法可行性,排除不靠谱的想法
  2. 快速开发一个MVP进行小流量AB测试
  3. 根据实验结果迭代优化原型
  4. 扩大实验流量,进一步验证效果
  5. 评估是否达到全量发布的标准

这套流程能最大限度降低实验风险,确保每一个新功能都能经受住市场检验,避免盲目开发。

六、实验优先级排序的实际应用

介绍了ICE模型的原理和案例之后,我们再来谈谈在实际工作中应该如何灵活运用这一工具。

1. 不追求评分的绝对精确,重在提高实验频率和数量

ICE模型的价值在于为实验排序提供参考,而不是追求每个维度评分的绝对准确。我们要把更多时间放在提高实验的频率和数量上,而不是过度纠结于评分标准本身。

一个月能做10个有价值的实验,远比花一个月时间只做1个经过精细评估的实验更有助于增长。大胆假设,小步快跑,用最短时间完成从想法到数据验证的闭环,才是实验的正确打开方式。

2. 形成个性化的排序指标

ICE模型是一个可塑的框架,我们完全可以根据自己的实际情况对评分指标进行调整。比如某些B端产品会格外重视用户体验,甚至愿意为此牺牲一些短期的转化率。这时不妨增加”用户体验”作为第四个评分指标,甚至给予更高的权重。

毕竟实验初衷是为了给用户带来价值,如果实验伤害了用户利益,再高的指标提升也是南辕北辙。

3. 实验想法的定期更新和优先级调整

保持实验想法库的常青,也是一个增长团队应该养成的好习惯。每隔一段时间,就要对想法库进行一次升级迭代,淘汰那些已经过时的想法,补充新的灵感。

同时基于最新的数据分析对实验优先级进行重新评估,确保我们在每个阶段都在优先执行最有价值的实验,而不是被之前的评分所禁锢。

实验成功的要义不在于数量,而在于质量。ICE模型作为实验想法的优先级排序工具,其价值在于能够帮助我们明确哪些实验应当优先执行。

记住三个关键词:影响力、成功概率、难易程度。掌握这一模型,意味着在高速变化的互联网世界中,能够更快地找到并执行那些最有价值的实验假设。

本文由 @小黑哥 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 目前还没评论,等你发挥!