以短视频为例,解析推荐机制要点

~M~
11 评论 7482 浏览 140 收藏 10 分钟

对一款内容产品来说,由于内容数量庞杂、内容质量参差不齐,为了给用户带来良好的内容消费体验,推荐机制成了筛选/推荐优质内容的不二之选。而本文也以短视频模块的推荐机制为例,帮助大家了解推荐机制的要点。

我从事内容产品有两三年了,从最初接触的长视频到现在风靡的短视频,从最初的各类推荐位设计到现在的大屏内容推荐流设计,在此过程中积累了很多的经验,但却没有停下脚步来思考和总结。趁着疫情,我开始回想整个推荐方案,突然想总结一下,于是就有了如下——我的推荐四步曲。

我现在做的产品是内容型客户端(具体名字不便于透露,望谅解)。从产品核心功能设定到前后端详细功能设计,到项目跟踪,到发布上线,到运营培训,再到用户数据跟踪和产品维护都是我参与和推动的。

推荐功能只是作为整个产品的一部分,今天要说的是短视频模块的推荐机制。

短视频推荐机制经历了如下四步曲:

  1. 发布时间排序推荐;
  2. 根据用户喜好推荐;
  3. 增加运营干扰;
  4. 增加平台内容过滤机制。

下面,我按照顺序跟大家分步讲讲。

第一步:发布时间排序

在现在这个信息技术高速增长的社会,只要提到推荐,首先想到的是智能学习,但是我们首先选择的是发布时间排序,原因下面会说到。

1. 项目背景

  1. 缺少内容沉淀:我们主要采用公司专有人员创作,所以在内容数量上会有一定的缺陷。另外目标用户对内容的接受程度待考量,创作人员需要快速试错。创作人员需要根据的用户反馈,快速调整创作方案,再迅速投到产品中等待再次反馈,所以最新的内容,从用户角度来讲是更愿意看到的,从创作者来讲,也是最愿意让用户看到的。
  2. 没有用户数据:新产品,没有存量的用户行为数据做参考,如果立即使用智能推荐,对推荐结果好坏判断未知。
  3. 快速上线:产品需要一个月时间完成研发和上线工作。当时的人员配置是:1个安卓、1个ios、3个后台,在资源和时间上来看,难以完成数据量极大的推荐机制。

2. 方式机制

最终选择的是按照内容发布时间倒序为主、点赞量、评论量、转发量和收藏量为辅的排序方式。

  1. 发布时间倒序:按照内容发布时间新旧排序,新发布的内容用户先看到;
  2. 点赞量、评论量、转发量和收藏量为辅:如果存在发布时间相同的内容,先按照用户点赞量递减排序;点赞量相同,按照评论量递减;评论量相同按照转发量递减;转发量相同按照收藏量递减。如果收藏量相同则按照后台获取的优先顺序排序。

3. 线上运营情况

产品上线后2-3个月,不同类型间的内容播放数据(平均浏览量环比前日增长)出现两级分化的情况,有的类型是正增长,而较多类型处于负增长主要原因有两个:

  1. 用户基数较小,探究的样本空间就相对较小,所以分化比较严重;
  2. 这段时间为内容创作适应阶段,需要长期对标用户,调整创作方案和创作类型。

在大半年到1年时间,各类型间播放数据差异(平均浏览量环比前日增长)逐步减少,负增长类型有了明显减少,并且用户次日留存也逐步稳定在15%左右。

第二步:根据用户喜好推荐

1. 项目背景

上面说到按照发布时间为主的推荐排序在某些数据上表现较好,但是在用户平均使用时长在2分钟左右,比较低,为了提升用户平均使用时长和进一步提升留存,我们进入喜好推荐。

2. 方式机制

用户喜好推荐是通过用户行为和内容标签关联的数据为依据,喜好强度做判断,然后按照由强及弱进行推荐。做此类推荐首先需要有内容数据支撑和用户行为支撑。

  1. 内容数据支撑:在我们的内容库里面由运营人员设置了108个内容标签;
  2. 用户行为数据支撑:用户行为数据库里面记录了所有已登录用户历史的浏览、播放、点赞、分享、收藏数据。
  3. 喜好强弱评定方案:
  •   行为分数定义:对用户播放、点赞、评论、转发、收藏行为按照行为可靠性定义分数,总分10分;(每个平台不一样,我们播放分数5分,点赞2分,其他各1分)
  • 强弱判断:每条内容播放后,根据用户行为算出总分,以后就优先为用户推荐得分高内容的同类型内容;

3. 线上运营情况

上线后1周,用户平均使用时长上升到了2分钟—3分钟;

上线后1个月,次日留存稳定在20%-25%。

第三步:增加运营配置

1. 项目背景

  1. 运营需要:运营活动、时效性内容需要强制推荐;
  2. 优化上个方案:完全按照用户喜好推荐,导致同类型问题比较严重

2. 方式机制

在服务端返回的每组内容列表里面,增加适当个数的运营位(每个平台根据自己的规则来,我们服务端每次返回20条数据,所以我们配置的是第三个、第6个为运营位,原因是平台用户平均浏览数量是4个,所以在第三个放置,能保证大部分用户首次启动可以看到,同时也不会影响用户体验)。

3. 线上运营情况

很庆幸,上线后没有让用户评价使用时长降低,由于运营活动的有效触达,用户次日留存得到了很大提升,达到30%以上。

第四步:增加内容过滤机制

1. 项目背景

运营配置虽然解除了少数按照同质化问题(按照用户喜好推荐,可能会导致同类型问题比较严重),但是运营配置位置较少,而且具有较强主观意识。所以本次为平台过滤内容增加了两个位置

2. 方式机制

平台内容过滤机制:指的是通过平台用户对内容打分,过滤出优质内容和劣质内容,将优质内容推送给其他更多用户,劣质内容则淘汰不在推送。具实现方式如下:

  1. 制定随机种子:内容随机推送给100个用户(数量根据平台用户规模和库内内容存量定),然后通过100个用户对内容的行为操作统计分数;
  2. 优劣判断:设定优劣分数判定标准,150分以上为优质。(每个平台不一样,根据用户规模、内容情况和历史数据判定)
  3. 优质推送规则:100个随机用户完成打分后,将优质内容按照分数高低推送给其他用户,同时优质内容每天也会再次进行重计分和重排序。
  4. 打分规则:内容得分=完播系数*分数+是否分享*分数+是否关注*分数+是否评论*分数+是否点赞*分数+是否收藏*分数;
  • 分数:指的是每个行为占比,这里,设定所有行为总分=10,完播分数=5,其余各项分别=1;
  • 完播:指的是内容完整播放,进度条滑动不计算在内。

3. 线上运营情况

  1. 功能上线后,保持每天10条以上优质内容产生,目前来看,属于稳定的循环;
  2. 用户平均使用时长达到4分钟到5分钟;
  3. 用户留存达到35%以上。(留存增长较快,和运营、推广都有较大关系)。

后话

目前我正在着手机器学习对接方案,后面上线后再和大家做进一步分享。

以上就是截止到今年年初推荐功能的大策略调整,中间有几个小版本迭代就不再这里过多讲述了,希望能和大家共勉。

 

本文由 @pangTT 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 您好,麻烦问一下增加运营后台配置是怎么实现的,每次返回的20条数据都有两个运营配置的视频吗

    来自北京 回复
  2. 请问这个完播系数是什么,是全看完才算吗

    回复
  3. 有帮助到 非常感谢作者的分享

    回复
  4. 干货呀,给大佬点个赞。期待后续的分享~~

    来自上海 回复
  5. 请问不优质的视频怎么曝光,是否通过慢曝光的方式,还有机会变成优质视频,考虑视频流动性的问问题。

    来自河南 回复
  6. 这篇文章干货满满啊,正好需要,可以加个好友吗?有写问题想请教一下

    来自广东 回复
  7. 运营人员设置的标签怎么跟短视频挂钩?

    来自湖北 回复
    1. 具体方式和公司规模、资源相关。以下有部分策略可供选择
      1、从发布者角度:根据发布者标签选择、发布者ip标签属性区分;
      2、从平台侧:利用平台内容解析(画面、NLP技术)区分;
      3、阅读者侧:利用阅读者标注、阅读人群标识区分等。

      来自北京 回复
  8. 好文章,收益匪浅,可以加好友吗,有几个问题想请教您

    来自上海 回复
    1. 可以啊

      来自北京 回复
    2. 你好,怎么加好友,我也想请教您

      来自湖南 回复