如何设计数据干预策略?

6 评论 6854 浏览 18 收藏 26 分钟

编辑导语:数据干预策略虽然被广泛使用,但不少朋友可能不清楚这其中的原理,数据干预是怎样对运营起作用的?怎样才能做到高质量引流?本文全方位透彻地为你分析了数据干预策略的设计理念,一起来学习一下吧~

8月27日,国家网信办就《互联网信息服务算法推荐管理规定(征求意见稿)》公开征求意见。在此背景下,数据干预行为即将由以前的灰色地带转为违法行为。

在法律条文正式落地以前,本文将基于笔者的个人经验分享“数据干预”这一大部分人“听过、没见过”的设计要点。

一、数据干预的价值

1. 什么是数据干预

这里所讲的“数据干预”指的是平台方主动发起的、对平台上的内容(视频、课程、文章……)的外显互动数据(点赞、收藏、分享、投币、播放、打赏、赞赏、关注、订阅……)进行修改(通常是注水)的行为,在阅读本文时需要与 用户侧发起的黑产刷数据行为进行区分,也不涉及金融领域的业绩造假。

2. 为什么要做数据干预

数据干预是纯粹的运营导向行为,其价值逻辑主要体现在:

通过为内容资源的互动数据注水(脱水),提高(降低)目标内容在资源纷发中的推荐权重,使得该内容对象有更高/低几率出现在首页、推荐页等用户侧页面。更高/低的曝光率又能带来更高/低的真实用户参与互动。

换言之,运营可通过干预外显互动数据,为目标内容导流。

举例来说:

运营发现视频A质量优秀,但是因为各种原因,视频播放量太低;播放量起不来的话极易被系统识别为低质视频,降低推荐权重;推荐权重降低后,视频A曝光率降低,普通用户难以触达;普通用户难以触达,挖掘不了该“宝藏视频”,又会进一步导致视频的播放量起不来。如此形成了一个负向闭环。

此时,运营可利用“互动数据干预策略”,为该视频投放1万个虚假播放量、5000个虚假点赞量,投放时间为1天。投放生效后,分发系统识别到该视频最近24H内互动数据快速增长,有爆火潜力,就会将视频推荐到视频首页、今日top排行榜。

普通用户在首页、排行榜看到该视频,就会尝试观看,发现质量很高,慷慨打赏;视频的真实互动数据因此快速、持续获得增长,最终该优质视频的真实互动数据与其质量匹配,跨过了“宝藏无人识”的尴尬局面。

观众获得了优质的观看体验,up主获得收益,平台获得用户数据增长,三赢局面。

除此之外,“小闲”型用户在消费内容前,会观察所选内容的各项外显数据量。运营通过干预策略,使得外显的互动数据量显得不那么寒酸,从用户心理上引导用户继续消费路径。

举例来说:视频的播放量、点赞量是0时,对于普通用户的吸引力极低,即使分发系统已将视频曝光至用户侧,用户仍然不会进行最终消费;如果外显播放量是1000,那么普通用户会自然地点开播放按钮,真正地消费内容,

如果平台运营提出此能力需求,一般基于以下业务目的考虑:

产品冷启动:产品冷启动阶段,平台内所有的内容资源的曝光率不足,用户真实互动数据全部为0或极低,推荐系统难以有效执行. 此时做数据干预对于纷发的影响效果立竿见影。冷冷清清的氛围也难以吸引首批用户,通过数据干预营造“虚假繁荣”对于小闲用户留存非常重要。

流量扶持:“流量扶持”是一种经常被用到的运营策略,数据干预策略是流量扶持的一种主要实现形式。当平台大战、互挖创作者时,运营可将“流量扶持”作为签约条件吸引优质创作者入驻;平时亦可将“流量扶持”作为平台活动奖励。

降低长尾创作者流失率:对于广大长尾创作者来说,很难通过创作盈利以解决吃饭问题,因此大部分创作动机来源于热爱、尝试心理。

矛盾的是,因为发布内容频率低、账号沉淀的粉丝少、平台未签约导致运营扶持政策少等综合因素导致这些小创作者“为爱发电”创作的内容很难得到足够曝光,更难得到观众互动回应。

“辛辛苦苦忙碌一周,发布后观看、点赞的观众不足10个”,这种努力过后得不到回应的感觉对于这些凭热情创作的创作者无异于当头浇了一盆冷水,极大摧毁创作积极性。

通过为长尾创作者执行普遍化地数据干预策略,使得他们的创作内容普遍能收获几十个点赞量,从而鼓励他们坚持创作,不至于从平台流失。

3. 什么是“好”的数据干预策略?

数据干预行为本身是数据造假行为,“造假”的最高标准自然是无限接近真实,用户(内容创作者、内容消费者)对干预行为毫无察觉。

要想达到这个标准不是件容易的事,竞争对手、黑粉、忠实用户很容易通过关联的蛛丝马迹发现端倪。建议产品经理在做设计时、运营在进行策略配置时,重点注意以下方面的控制:

(1)关注互动数据项之间的整体均衡

当内容有多个互动指标时,经过干预后的外显数据整体看起来必须足够均衡、合理。若某篇文章的阅读量小于点赞量,那么这就是脑溢血型数据干预;若某个英语学习视频的分享量大于点赞量,那么看起来会“一眼假”,用户会明显察觉不合理。

某视频平台,单个视频的互动量比例不自然

(2)关注互动数据项与内容质量的匹配度

一般来说,运营做数据干预的原始初衷是帮助优质内容增加曝光量,那么质量低劣的内容资源就不应该享受太高的数据注水,否则一方面会挤占真正优秀视频的纷发空间,造成劣币驱逐良币、平台创作环境恶化,另一方面大量“小闲”用户通过“爆火”标签查看视频时,却发现“名不副实”“受到了欺骗”,自然产生对平台的恶感,产生用户流失。

(3)关注互动数据项与创作者收益的平衡

内容创作平台为了进行创作者激励,通常会将内容的互动数据表现作为创作者收入的影响因子。

具备数据干预能力后,创作者收益计算时,必然使用的是真实互动数据。然而由于信息壁垒,创作者不知道自己的外显数据为灌水后的数据,会自然地使用外显数据计算收益预期。

当最终收益下发时,创作者发现收益与预期不符,会产生强烈的被骗感,与平台的关系自然跌入冰点。解决该矛盾的通用做法是:

  • 收益计算公式对创作者不透明(即不会明确告知各项互动数据指标在收益计算中的比重)
  • 提供多种收益渠道(创作激励、广告分成、直接打赏、活动奖励等),降低互动数据对收益的影响比重
  • 引入中间指标如“热度”“喜爱度”等,教育创作者“最终收益与中间指标直接关联,中间指标不仅受互动数据量影响,也会被互动数据比、up主活跃度、产出频率、原创类型、创作者类型等等因素影响”。

因此,当创作者的外显互动数据量因运营干预有了较大增长,收益却未获明显上涨时,平台方可拿其他因素进行解释。只要数据造假不至于太离谱,创作者也能接受收益与预期不符的事实。当然,总体设计上仍需要保证“互动数据表现越好,收益越高”的基本原则。

某站的收益类型多,并且不会明确告知互动数据影响收益的计算公式

(4)关注互动数据项与其他关联数据项的匹配度
互动数据通常在内容消费路径中展示,用户直接触达,因此做好上述3点平衡后,一般用户不会对干预行为有察觉。但是,有心人可以通过其他关联数据间接推测出数据干预行为的存在。

例如:若某个创作者内容平均浏览量为10万,但是该创作者的关注粉丝数只有10个,那就出现“一眼假”;若某个主播专栏作者每篇文章在平台内的阅读量平均10万+,但是平台的对外财报显示月活跃用户一共10万+,那么竞争对手就可以揣测出该专栏作者的数据有水分。

某博主,粉丝数1亿,单条内容评论量只有600

互动数据与其他关联数据的匹配极易成为大坑,主要是因为:

“其他关联数据”的计算、产出、发布、展示通常不受互动产品经理和策略运营控制、负责。例如上述举例中,“关注”功能归属于用户体系设计范畴,“对外财报”更是财务、数据等多部门配合的结果。若需进行协调,往往涉及跨部门的合作,非常考验产品经理和策略运营的个人能力。

“其他关联数据”的类型不可控。在做产品设计和具体的干预策略设计时,产品和运营可能已经对潜在的其他关联数据类型做了摸排,确保所有的相关数据看起来协调、自然。

但是随着时间的推移,其他业务线新增的功能体系可能会导致新的关联数据类型产生,又由于数据干预的敏感性、保密性很高,关联业务负责人不掌握具体干预信息,导致新的数据类型在设计、产出、发布时没有兼顾数据干预系统的存在,最终使得互动数据与其他关联数据不匹配。

二、实战复盘

1. 数据干预的支撑系统——Bot假账号系统

最广为人知的Bot假账号是微博的僵尸粉、直播平台的机器人观众。这类系统在数据干预体系中扮演基础设施的作用——被干预的虚假数据由这些账号来模拟真实用户路径从数据层进行承载。

举例来说:运营配置干预策略,为某篇文章注入100个虚假收藏量。系统即向Bot账号系统中提取100个账号,将这篇文章收藏至自己的收藏夹。后续若有第三方读者可以在假帐号的收藏夹内找到该文章。文章创作者也会收到文章被用户ABC收藏的消息推送。

Bot假帐号系统能极大提高数据干预的真实性,既可以通过体验层模拟真实用户行为,“骗”过内容创作者、内容消费者,又能够在数据层面瞒过第三方数据爬取、统计机构的数据过滤系统。

那么,Bot假账号系统的搭建设计有哪些注意要点呢?

1)重视通用性

Bot假帐号系统之所以被定义为“基础设施”,原因在于:

  • 其服务的业务方向多样。最常见的如互动数据干预系统、用户体系干预系统。
  • 单个业务方向,具体的数据指标多样。例如互动数据干预系统内包含点赞、收藏、分享,每一个指标的实现都有其独特性。

因此Bot假账号系统在初始搭建时应以组件思维进行规划,以适应后续可能接入的多业务类型。

2)重视账号调取的效率

  • 能配合干预业务需求进行及时、高并发、大数据量的账号调取、模拟
  • 能避免同一账号对同一内容目标的反复调取。在互动数据干预业务里,同一个账号对同一目标的反复互动经常意味着“互动取消”,例如点赞/取消点赞。

3)重视假账号的真实性维护

不论假账号来源于平台内的流失用户,还是系统自行创建,都需有维护机制,确保这些账号足够真实。一个真实性过关的账号需满足:

  • 符合普通人认知的基本要素。例如完整的头像、不至于不知所云的用户名、参差的等级、勋章、VIP头衔等。
  • 正常的对外消费历史记录。假设1个bot账号的等级为满级,其对外原创内容为0,则很容易被用户识别为假帐号。设计者可以从2方面来入手:一方面通过优化账号调用能力,确保每次调用时,优先选取未有消费历史的账号,为其创造消费历史;另一方面,设计账号历史对外隐藏功能,第三方用户无法查看目标账号的历史消费记录。

那么,如果平台内未有Bot账号系统能力,是否就不能进行数据干预设计呢?并不是。

Bot假账号系统是进行数据干预的充分非必要条件。

特别是对于互动数据干预而言,若内容平台内被干预的互动数据项本身不存在“对外信息公开”机制,那么在进行数据干预时可以不利用假账号进行承载,仅进行简单的数值增减。

举例来说:若内容平台内,普通用户无法查看其他用户的收藏夹内容,创作者侧也没有内容被收藏的消息推送、清单统计,那么进行收藏量干预时,完全可以直接在目标内容上进行数值变更。

2. 数据干预策略设计

数据干预系统的核心是策略系统,即 运营如何依据业务特征设立干预目标。

基于笔者自己的经验,干预策略的设计根据不同的维度有以下类型:

(1)根据策略的生效范围,可分为单目标干预、范围干预

  • 单目标干预:本策略的生效范围仅限于特定的某个内容对象,例如某篇文章、某个视频、某个帖子
  • 范围干预:本策略的生效范围为某个创作者、某个品类、某个标签、某个白名单下的所有内容对象

(2)根据策略的生效方式,可分为 自动水下策略、半自动策略、人工水上策略

  • 自动水下策略:系统写死干预规则,程序自动生效,无需运营介入。
  • 半自动策略:运营需维护策略模板池,若需对某个内容生效,只需从池中捞出对应模板关联至目标内容,程序即会依据模板规则对目标内容进行数据干预。
  • 人工水上策略:每次设定干预任务时,需重新配置干预规则。

(3)据策略的规则类型

可分为:数值投放策略、增长倍率策略、内容投放策略

  • 数值投放策略:设定目标增长值和生效时间段,程序在时间段内均匀进行投放。例如:运营希望在24H内为视频A投放24万个点赞。那么程序每1H会为该视频投放1万个虚假点赞量。
  • 增长倍率策略:系统仅会在真实用户互动数据产生时进行假数据投放,其计算规则为“扩大真实互动数据的倍率”。例如:当有1个真实用户进行转发时,外显转发量直接+10,其中9个为假转发量。
  • 内容投放策略:批量为目标对象投放互动内容值。当互动数据项为非数值项时,仅能采用该策略,典型的如视频弹幕量、评论量。

产品经理可依据业务特点,将上述不同类型的干预类型进行混合应用,从而得出不同的干预策略设计。

3. 数据干预策略生效规则

数据干预系统的难点在于策略生效规则,即程序如何进行虚假数据投放。

策略设计时需考虑的实现难点

第一,虚假数据投放时,需兼顾不同数据项的整体平衡。

以视频互动数据干预为例,进行数据投放时,必须保证:

  • 播放量在所有时间点必须永远大于点赞量、投币量、分享量、收藏量
  • 播放量、点赞量、投币量、分享量、收藏量之间的比率需与视频内容、平台特性相符。典型的一般视频的点赞量都大于收藏量,但软色情擦边球的舞蹈类视频往往收藏量大于点赞量

第二,多种干预策略对同一个目标生效时,需考虑如何避免某个数据项因策略并发导致总和异常的情况。

以某视频为例,若有5个干预策略同时对该视频生效,那么存在一定可能性,在某个特殊时间点,由于收藏量的投放速率更高,导致5个策略叠加的总收藏量大于叠加的点赞量。此时若有用户观察到该现象,即会察觉到数据异常。

第三,进行数据投放时,需符合平台内用户活跃时间段规律。

举例来说,一般用户在傍晚时段活跃程度高于凌晨0-8点,周五-周日活跃程度高于周一-周四。那么干预策略生效时,必须遵循高峰时段产生的虚拟量多、低活跃时段时产生的虚拟量少的规律。

第四,依据程序计算的应投虚假量为固定值,实际生效时应有一定浮动值。

否则,程序每次产生的虚拟量完全相同,极易引起察觉。

第五,在进行增长倍率策略生效时,需考虑到同一个干预对象的互动率随着投稿时间延续呈现先增长后降低的规律,随着播放量的增长也呈现一定的波动规律。因此干预策略生效时,也需遵循此规律。

第六,在进行干预策略设计时,产品经理需明确告知研发团队,“策略何时生效,每一次策略生效时应当产生多少虚假数量”,而不是“某段时间后,应该达到多少总虚假数量”。

因为前者是增量描述,更符合开发思维,能够帮助开发联系到如何实现;后者是存量描述,只是设定具体的目标,没有规定程序到底该怎么实现。举例来说,如果告诉开发“总投放目标量为1万,投放时间1天”,那么有可能他会实现成“前23H投放值为0,最后1H投放值为1万”。

第七,需妥善处理干预策略与风控系统的关系。对于内容平台来说,为了防止用户侧黑产数据,往往会有完善的风控系统对用户侧互动行为进行识别过滤。

那么,在进行干预策略生效时,既需要保证系统侧投放的虚拟数据可以绕过风控系统的即时拦截,又能在后续风控系统对真实用户数据进行回刷时,对该真实用户数据带来的虚假数据进行联动回刷。

那么以上这些难点,有没有什么系统的解决方法呢?有的。囿于工作保密性要求,本文不会对具体如何做进行描述,仅列出思考方向:

  1. 引入时间因素
  2. 围绕锚数据项,各数据项联动干预
  3. 向运营讲数值,向开发讲概率
  4. 任务流水&投放流水挂钩

4.干预数据的应用和人工回调

为了服务于后续数据统计分析业务,在进行干预策略设计时,需注意向开发传递以下信息:

  1. 当多干预策略同时对同一个目标生效时,最终外显数据如何展示
  2. 当多干预策略同时对同一个目标生效时,需分别记录每个策略产生的流水明细、统计值,方便下游业务依据需求自行取值做统计分析

由于:

  • 程序存在不可靠情况(多计算/少计算/多生效/少生效)
  • 运营配置失误情况

当数据干预系统内存在多干预策略时,可能存在被干预对象的各互动数据项最终显示异常的风险。此时需要有对应的处理机制:

  1. 运营可直接删除/下架/隐藏干预对象,此为最简单的处理方式
  2. 设计看板系统,运营侧可据此查询目标对象的异常数据来源于何种干预策略,快速定位失控原因,并下架对应策略
  3. 设计回调工具,可回调异常数值。

三、结语

数据干预本身是纯运营导向的需求,极易成为双刃剑,若使用不当,非常伤害用户体验(没错说的就是微博);但作为产品经理,需要能克服抗拒情绪,客观看待数据干预系统对产品和平台方的存在必要性,并在用户体验和运营价值之间找到平衡,设计出高效、安全的干预策略。

目前笔者混迹的几个产品经理社区难以找到这方面的设计沉淀资料,本文所述内容基本没有借鉴前人经验,全靠拍脑袋和实战得出,因此肯定存在失当之处,欢迎各位产品经理大神留言指正。

 

本文由 @十万号子手 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unsplash,基于CC0协议。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 看完了,提到的很多点非常实在~获益匪浅

    来自四川 回复
    1. 欢迎探讨

      来自湖北 回复
  2. 很不错哦。数据干预

    来自上海 回复
    1. 你是机器人吗?是pm平台的干预吗?

      来自湖北 回复
    2. 学以致用,666

      来自浙江 回复
    3. 膜拜真正的大佬

      来自湖北 回复