推荐策略:市场需求最大的策略产品经理方向!
随着环境和技术的发展,现在,企业对推荐策略产品经理需求逐渐涌现。那么,如何理解推荐策略,以及推荐策略产品经理画像?一起来看看本文的分享。
一、推荐策略
前文有提到,推荐策略是目前AI应用最广泛的场景之一,也是目前市场需求最大的产品经理方向。那么,为什么会出现如此大的策略产品岗位空缺呢?原因还应归结于AI。
随着5G、大数据的普及,用户数据量的跃升导致人工标签、分类的成本升高、产品功能模块细化,原有的自算法工程师转入策略产品经理的人选已经很难满足移动互联网时代对数据利用效率的需求,随着产品场景的细化,更多C端的、具有用户思维的推荐策略产品经理需求逐渐涌现,推荐策略产品经理岗位迎来了新一波的需求热潮。
推荐系统应用的标志性事件:
这些标志性事件的发生都基于一种需求:如何用推荐系统来实现爆炸性增长的信息与用户不断变化的兴趣和需求之间的高效匹配。
1. 推荐系统兴起的原因
1)时代的变化
10年起,移动互联网时代到来,4G普及、流量贬值,出现了以下三大问题:
- 如何用推荐系统来实现爆炸性增长的信息与用户不断变化的兴趣和需求之间的高效匹配;
- 如何更好地挖掘用户的个性化需求;
- 如何更好地让肠胃物料得到有效曝光。
2)数据的积累
移动互联网时代用户随时在线,产生了大量个人行为数据,通过埋点等技术可以收集大量用户个人信息,推荐模型学习资料充裕,推荐效果更“准”,其信息分发效率已经超过了传统模式。
3)技术的进步
数据是AI的基础,只有数据+算法才能max推荐系统的作用,10年后,算法工程师引入大规模机器学习框架,大幅提高了推荐系统模型分发的效率和效果,14年左右,深度学习在推荐系统开始落地应用,进一步提升了推荐效果。
4)算力的进步
最新的GPU训练一个模型只需要3小时,而老GPU三天都不止!
总而言之,互联网环境变化造成信息过载(人们被超过认知极限的信息所包围)和长尾问题(传统人工运维模式导致信息分发在各环节的转化效率过低),而推荐系统恰好有效解决了这些问题。
2. 推荐系统概述
推荐系统,本质是一种信息过滤系统,用来预测用户对于物料的评分和偏好,建立用户和物料之间的连接。其主要解决了信息过载与长尾问题(如前文)。
推荐系统中预测新链接就一定需要旧链接的输入,对于所有机器学习模型,均要基于历史数据学习,目前的核心模块仍是CTR预估模型。
- 在电商领域,系统基于用户购买、点击、加购、收藏行为为用户推荐相似商品。
- 在内容场景,系统基于用户浏览、点赞、分享、评论、收藏内容为用户推荐可能感兴趣的内容。
3. 推荐系统发展四阶段
1.0阶段 基于内容的推荐
基于内容标签与用户兴趣爱好标签的相关性判断,没有使用用户的历史行为数据,主要靠达标、计算标签间的重合度进行运算。
2.0阶段 协同过滤
基于内容标签与用户兴趣爱好标签的相关性判断,开始使用用户历史行为数据,通过用户与物料的交互数据来评估物料之间、用户之间的关联度,而非仅依靠标签体系。
趋势:自动化、个性化、智能化
3.0阶段 多路召回+精排
相比于前两个版本有非常大的变化,主要有两大变化:
- 核心指标变为CTR:1.0与2.0的指标实际是相关性指标,此指标为中间指标。而在3.0阶段,推荐系统加入精排环节,精排环节以CTR预估为核心目标,并以预估的CTR作为最终排序参考,此时使用的机器学习算法主要为LR,GBDT。
- 召回、排序环节拆分,召回架构改为多路召回:1.0-2.0版本召回顺序即为排序顺序,在3.0版本,首先召回用户初步感兴趣的东西,在排序环节进行CTR的预估,最后以预估值进行排序。以电商为例。常见召回策略有高点击率、热销、复购、高质量分、Item-CF等。
4.0阶段 深度学习+重排+样式创意
全面应用深度学习技术,精排后加入重排环节,模块拆分细化、模块策略精化。
4. 推荐系统整体架构
以电商场景为例进行介绍:
1)物料索引
APP内有一个可以推荐给用户的物料池,物料池存储在数据库中,为了便于查询,我们需要提前构建索引,尤其是在基于标签召回情况较多时。物料清洗和索引构建是推荐系统的基础工作。
2)召回层
初筛用户可能感兴趣的一些物料,进入粗排和精排。
3)粗排层
粗排策略分为两种:1.基于统计 2.基于模型,核心思想均为对各路召回的物料进行再排序,再取物。
基于统计:对单一召回路的相关性分数进行归一化和加权。
基于模型:用粗排的CTR模型预估召回点击率,按照召回点击率排序取物。
4)过滤层
通常把过滤层放在精排层之前,粗排层之后或者召回层之后,以减少算力、人力资源的浪费。其主要作用是将最终不能在APP前端展示的物料过滤掉。
概念补充:SKU与SPU
SKU :(Stock Keeping Unit / 存货单位 ):引申为产品统一编号的简称,如“iPhone-4GB(GPU)-256GB(内存)-黑色”。
SPU:(Standard Product Unit),标准化产品单元。是商品信息聚合的最小单位,是一组可复用、易检索的标准化信息的集合,该集合描述了一个产品的特性,如iPhone。
5)精排层
中心任务是预估粗排层返回的前几位商品的点击率和曝光率,一般精排点击率预估值为核心指标。部分场景会考虑曝光率预估值。其与粗排层的模型核心差异主要有以下两点:
- 差异一:模型训练样本不一样。正样本都是用户最终点击的行为数据,但是负样本完全不一样。粗排的负样本是召回层召回但是没有点击的物料,这些物料有可能都没经过曝光。精排层的负样本是APP前端曝光但用户没有点击的物料
- 差异二:模型复杂度完全不一样。目前的CTR预估模型几乎都是基于深度学习的DNN模型。由于粗排层主要用于初步筛选,所以推荐系统对于召回、粗排的性能要求高,时延TP99容忍度低(Top99%的网络请求所需要的最低耗时),故而此处模型复杂度、高维特征较简单,而对于精排模型TP99的时延容忍度更高,所以使用特征维度更多、网络结构更复杂。
6)重排层
从群居最优角度微调物料顺序,还会基于用户体验和业务诉求进行一些类目打散、同图过滤和相关物料调权等操作,最终将至返回给APP前端。
7)APP前端
物料顺序不再变化,进行相关样式和创意信息的补充,呈现样式、风格和创意信息,即UI设计。
8)特征服务
底层的基础服务,内有大量加工好的用户特征、物料特征、场景特征等。
5. 常见效果评估指标
- 电商场景:CTR、加购率、CVR、CTCVR、PGMV、多样性、新颖性、停留市场、浏览深度
- 内容社区:补一个互动率
- 短视频APP:补充人均视频播放量、人均观看时长、视频有效播放量、视频完播率等
二、推荐策略产品经理画像
如前文所述,一方面推荐系统模块精细化,另一方面推荐系统应用场景多样化,原有的工作内容不再适合算法工程师来承担,为此,产生了推荐策略产品经理的岗位,更多基于业务视角和用户体验视角的C端产品经理开始做推荐策略产品工作。
目前市场上主要有两种推荐策略产品经理:电商与内容。
本文由 @策略产品经理规划 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
- 目前还没评论,等你发挥!