以短视频为例,解析推荐机制要点
对一款内容产品来说,由于内容数量庞杂、内容质量参差不齐,为了给用户带来良好的内容消费体验,推荐机制成了筛选/推荐优质内容的不二之选。而本文也以短视频模块的推荐机制为例,帮助大家了解推荐机制的要点。
我从事内容产品有两三年了,从最初接触的长视频到现在风靡的短视频,从最初的各类推荐位设计到现在的大屏内容推荐流设计,在此过程中积累了很多的经验,但却没有停下脚步来思考和总结。趁着疫情,我开始回想整个推荐方案,突然想总结一下,于是就有了如下——我的推荐四步曲。
我现在做的产品是内容型客户端(具体名字不便于透露,望谅解)。从产品核心功能设定到前后端详细功能设计,到项目跟踪,到发布上线,到运营培训,再到用户数据跟踪和产品维护都是我参与和推动的。
推荐功能只是作为整个产品的一部分,今天要说的是短视频模块的推荐机制。
短视频推荐机制经历了如下四步曲:
- 发布时间排序推荐;
- 根据用户喜好推荐;
- 增加运营干扰;
- 增加平台内容过滤机制。
下面,我按照顺序跟大家分步讲讲。
第一步:发布时间排序
在现在这个信息技术高速增长的社会,只要提到推荐,首先想到的是智能学习,但是我们首先选择的是发布时间排序,原因下面会说到。
1. 项目背景
- 缺少内容沉淀:我们主要采用公司专有人员创作,所以在内容数量上会有一定的缺陷。另外目标用户对内容的接受程度待考量,创作人员需要快速试错。创作人员需要根据的用户反馈,快速调整创作方案,再迅速投到产品中等待再次反馈,所以最新的内容,从用户角度来讲是更愿意看到的,从创作者来讲,也是最愿意让用户看到的。
- 没有用户数据:新产品,没有存量的用户行为数据做参考,如果立即使用智能推荐,对推荐结果好坏判断未知。
- 快速上线:产品需要一个月时间完成研发和上线工作。当时的人员配置是:1个安卓、1个ios、3个后台,在资源和时间上来看,难以完成数据量极大的推荐机制。
2. 方式机制
最终选择的是按照内容发布时间倒序为主、点赞量、评论量、转发量和收藏量为辅的排序方式。
- 发布时间倒序:按照内容发布时间新旧排序,新发布的内容用户先看到;
- 点赞量、评论量、转发量和收藏量为辅:如果存在发布时间相同的内容,先按照用户点赞量递减排序;点赞量相同,按照评论量递减;评论量相同按照转发量递减;转发量相同按照收藏量递减。如果收藏量相同则按照后台获取的优先顺序排序。
3. 线上运营情况
产品上线后2-3个月,不同类型间的内容播放数据(平均浏览量环比前日增长)出现两级分化的情况,有的类型是正增长,而较多类型处于负增长主要原因有两个:
- 用户基数较小,探究的样本空间就相对较小,所以分化比较严重;
- 这段时间为内容创作适应阶段,需要长期对标用户,调整创作方案和创作类型。
在大半年到1年时间,各类型间播放数据差异(平均浏览量环比前日增长)逐步减少,负增长类型有了明显减少,并且用户次日留存也逐步稳定在15%左右。
第二步:根据用户喜好推荐
1. 项目背景
上面说到按照发布时间为主的推荐排序在某些数据上表现较好,但是在用户平均使用时长在2分钟左右,比较低,为了提升用户平均使用时长和进一步提升留存,我们进入喜好推荐。
2. 方式机制
用户喜好推荐是通过用户行为和内容标签关联的数据为依据,喜好强度做判断,然后按照由强及弱进行推荐。做此类推荐首先需要有内容数据支撑和用户行为支撑。
- 内容数据支撑:在我们的内容库里面由运营人员设置了108个内容标签;
- 用户行为数据支撑:用户行为数据库里面记录了所有已登录用户历史的浏览、播放、点赞、分享、收藏数据。
- 喜好强弱评定方案:
- 行为分数定义:对用户播放、点赞、评论、转发、收藏行为按照行为可靠性定义分数,总分10分;(每个平台不一样,我们播放分数5分,点赞2分,其他各1分)
- 强弱判断:每条内容播放后,根据用户行为算出总分,以后就优先为用户推荐得分高内容的同类型内容;
3. 线上运营情况
上线后1周,用户平均使用时长上升到了2分钟—3分钟;
上线后1个月,次日留存稳定在20%-25%。
第三步:增加运营配置
1. 项目背景
- 运营需要:运营活动、时效性内容需要强制推荐;
- 优化上个方案:完全按照用户喜好推荐,导致同类型问题比较严重
2. 方式机制
在服务端返回的每组内容列表里面,增加适当个数的运营位(每个平台根据自己的规则来,我们服务端每次返回20条数据,所以我们配置的是第三个、第6个为运营位,原因是平台用户平均浏览数量是4个,所以在第三个放置,能保证大部分用户首次启动可以看到,同时也不会影响用户体验)。
3. 线上运营情况
很庆幸,上线后没有让用户评价使用时长降低,由于运营活动的有效触达,用户次日留存得到了很大提升,达到30%以上。
第四步:增加内容过滤机制
1. 项目背景
运营配置虽然解除了少数按照同质化问题(按照用户喜好推荐,可能会导致同类型问题比较严重),但是运营配置位置较少,而且具有较强主观意识。所以本次为平台过滤内容增加了两个位置
2. 方式机制
平台内容过滤机制:指的是通过平台用户对内容打分,过滤出优质内容和劣质内容,将优质内容推送给其他更多用户,劣质内容则淘汰不在推送。具实现方式如下:
- 制定随机种子:内容随机推送给100个用户(数量根据平台用户规模和库内内容存量定),然后通过100个用户对内容的行为操作统计分数;
- 优劣判断:设定优劣分数判定标准,150分以上为优质。(每个平台不一样,根据用户规模、内容情况和历史数据判定)
- 优质推送规则:100个随机用户完成打分后,将优质内容按照分数高低推送给其他用户,同时优质内容每天也会再次进行重计分和重排序。
- 打分规则:内容得分=完播系数*分数+是否分享*分数+是否关注*分数+是否评论*分数+是否点赞*分数+是否收藏*分数;
- 分数:指的是每个行为占比,这里,设定所有行为总分=10,完播分数=5,其余各项分别=1;
- 完播:指的是内容完整播放,进度条滑动不计算在内。
3. 线上运营情况
- 功能上线后,保持每天10条以上优质内容产生,目前来看,属于稳定的循环;
- 用户平均使用时长达到4分钟到5分钟;
- 用户留存达到35%以上。(留存增长较快,和运营、推广都有较大关系)。
后话
目前我正在着手机器学习对接方案,后面上线后再和大家做进一步分享。
以上就是截止到今年年初推荐功能的大策略调整,中间有几个小版本迭代就不再这里过多讲述了,希望能和大家共勉。
本文由 @pangTT 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
您好,麻烦问一下增加运营后台配置是怎么实现的,每次返回的20条数据都有两个运营配置的视频吗
请问这个完播系数是什么,是全看完才算吗
有帮助到 非常感谢作者的分享
干货呀,给大佬点个赞。期待后续的分享~~
请问不优质的视频怎么曝光,是否通过慢曝光的方式,还有机会变成优质视频,考虑视频流动性的问问题。
这篇文章干货满满啊,正好需要,可以加个好友吗?有写问题想请教一下
运营人员设置的标签怎么跟短视频挂钩?
具体方式和公司规模、资源相关。以下有部分策略可供选择
1、从发布者角度:根据发布者标签选择、发布者ip标签属性区分;
2、从平台侧:利用平台内容解析(画面、NLP技术)区分;
3、阅读者侧:利用阅读者标注、阅读人群标识区分等。
好文章,收益匪浅,可以加好友吗,有几个问题想请教您
可以啊
你好,怎么加好友,我也想请教您