推荐策略产品经理实操(四):推荐内容诊断平台
导读:作为归属为推荐算法部门的产品,每天有非常多和单个推荐内容业务指标变化有关的问题需要解答,因此,推荐部门做了一个可供查询的内容数据转化平台,便于运营或业务同学检测游戏的数据转化问题对应的原因。本文作者对此进行了分析,与你分享。
作为归属为推荐算法部门的产品,平时听到比较多的关于推荐业务的问题就是:
- XX内容怎么曝光降了这么多?
- XX内容数据这么好,曝光怎么就是上不去?强插都上不去?
- XX为什么前几天数据不好,这几天数据变这么好……
非常多和单个推荐内容业务指标变化有关的问题需要解答,因此,推荐部门做了一个可供查询的内容数据转化平台,便于运营或业务同学检测游戏的数据转化问题对应的原因,也便于我们发现推荐系统实际存在的问题,及时做出修改优化。
一、背景及目的
(1)为推荐内容提供透明化转化漏斗查询平台
便于运营/商务/广告等多方业务查询问题,根据游戏在每一步的过滤、转化、在大盘中的位置等信息,便于查询游戏在每个步骤中的内部转化情况,明确游戏的转化路径,及时做相关业务调整;
(2)根据数据异常内容推断推荐系统存在的问题,及时优化
根据异常点击率、时长、或突然大幅度变化的游戏数据,反推推荐系统某一步骤存在的缺陷,进一步优化系统;
(3)对比竞品推荐系统,制定优化方向
对比竞品app中能成为头部或热门的内容,对比自己平台内容为什么没有推出来或没有到达同等高度,是合作问题还是哪一步存在的问题导致,进一步优化推荐系统;
二、平台实现逻辑
平台主要做在superset上,主要数据逻辑如下:
(1)首先是数据收集,需要将用到的所有数据都通过推荐后端落日志生成数据,其中用到最多的就是内容召回量统计和过滤量统计(如上图),需要事先根据推荐流程进行数据规划,这一步比较重要,后面的数据诊断,都依赖这一步的数据收集;
(2)其次是数据建表,这一步需要跨部门合作大数据部门,需要将日志中的数据依照某些特定维度进行建表,这一步主要是根据数据诊断的几个维度进行建表,例如内容打分下发表、内容召回过滤表、内容黑名单表、内容时长分布表、内容打分在内容库的排名等等,都需要数据处理;
(3)最后是数据表汇总,需要将之前的全部数据表,以游戏和时间筛选维度汇总到一起,形成一个游戏数据查询平台,其本质就是“单一内容的多表查询”,到这一步,平台基本上就搭建好了。
三、平台数据查询的几个维度
推荐数据诊断平台主要是用来做内容打分竞争力查询、有掉量趋势的内容监控及分析、有潜力的内容找不足进行优化、市面上竞品的内容推出来而我们推不出来的原因查询等。下面讲几个我们在实际使用中用到最多的几个维度数据查询,主要按照查询顺序讲:
(1)内容曝光人数
这一步主要是确认内容数据表现是波动还是稳定的,如果曝光人数较少数据很好却推不出来,大概率是数据波动或这一类内容只适合小部分人群,可以去其他人群上验证这个问题,或进行强插验证数据变化;
(2)内容召回-过滤次数对比
这一步上面第二部分也讲了一些,主要是看内容是否会在某一步骤被大量过滤掉导致不出量,基本上在重排这一步做的某些策略会过滤掉大量的数据,以及粗排截断的时候会过滤掉一部分曝光,或者命中一些现下的业务策略等,基本上都是这样的情况;
(3)内容在各模型上的打分以及转化率
这一步是比较直观的数据说话阶段,通常会发现内容的曝光起不来,多数和内容的高点击低转化相关,或者点击率太低等原因,这一步如果需要优化,也可以听过优化图标或加角标的方式提升点击率进一步提升转化的方法解决;
(4)内容下发打分排名均值
有时候,游戏的数据很好,就是不起量,这个时候,需要对比的不是模型打分,而是内容在所有内容打分中的排序,这个数据能够很直观的看到内容在内容库中的排名,是靠前还是靠后,对比同位置段的内容数据,基本差不多就不存在问题。
涉及的维度较多,就不一一展开讲,这里主要是讲一个查询问题的思路,主要是需要在熟悉业务逻辑的基础上展开的数据收集而生成的一个数据诊断平台,因为业务不相同,大概率各公司的数据诊断都会存在差异,欢迎大家互相交流。
加油,打工人!
本文由 @王珂 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
求大佬微信
期待下一篇