推荐算法：Match与Rank模型的交织配合 | 人人都是产品经理

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

{{ userInfo.member ? '查看权益' : '开通会员' }}

发布

注册 | 登录

推荐算法：Match与Rank模型的交织配合

Link

2017-12-21

2 评论 13728 浏览 88 收藏

5 分钟

电商环境下的个性化推荐，主要包含三大维度的模块，针对用户的候选召回（Match），候选商品的精排（Rank），以及线上的策略调控（Re-rank）。而Match（召回）和Rank（排序）是推荐流程非常关键的两步。

一、Match

Match即有效和丰富的召回，从全量商品（还包括feed和视频等）集合中根据用户行为和属性信息触发尽可能多正确的结果，并将结果返回给Rank。

推荐不同与搜索，在没有明确Query触达的情况下，用户的Match召回就显得尤为重要，希望相关性的信息尽可能的丰富。

因此Match面对的是整个商品库集合，需要保留尽可能多的相关结果，剔除相关性较弱的结果，降低对后面链路的压力。

由此需综合利用多种信息，比如用户信息（年龄、性能、购买力等）、类目信息、店铺信息、文本信息等。从而既保证高召回率，又要保证高的准确率。Match结果的好坏，对整个结果有重要的影响。

Match召回策略主要包含两大类：基于内容匹配的召回和基于协同过滤的召回。

前者主要是基于用户的画像信息和商品的内容信息进行匹配召回。这种方式召回率较高，但精度较差，比较适用于冷启动的语义环境。

后者主要是基于用户和商品之间的行为矩阵，通过一系列策略得到用户和候选商品之间的相关性；这种方式精度较高，但存在一定程度的冷启动问题。协同过滤是当前推荐依赖的基础策略。

二、Rank

Rank即精排，通过一个准确的预估模型对Match阶段海选的商品进行精准打分，并根据打分结果进行排序截断，决定最终向用户展示的结果顺序。

Rank模型两大要素为特征抽取和打分模型学习训练。

特征抽取的第一步也是最为重要的一步就是清洗日志，曝光日志可以通过日志埋点进行过滤，并结合更准确的搜索、点击、收藏等用户行为日志，进行User_id和Item_id维度的聚合，最终将两份日志Join在一起构造为用户特征样本。

特征抽取除了基本属性特征，如user_id,item_id,user的年龄性别等人群特征，有小时级或分钟级回流的准实时反馈特征，还包括user端和item端双向交叉特征，如user在不同类目下的偏好程度，item在不同性别年龄购买力人群下的ctr等。

除了用户实时特征外，还会进行离线模型的日志及特征的接入、预处理以及离线特征的统计工作，作为实时特征的补充，这里处理长期兴趣的统计类特征的准备以及各种平滑过滤逻辑，在数据侧提供了保障。

打分模型主要分为CTR与CVR预估模型，在展示商品前，结合用户历史行为&商品&场景信息，预估展示商品之后用户是否会点，或点击之后是否会购买，从而在Rank时有不同的CTR与CVR倾向。

目前，成熟的排序模型都是多维度分数融合排序，获取多个维度的预估分，包括CTR预估，CVR预估，笔单价和商品毛利润，根据业务指标进行调控，计算最终的RankScore。

三、End

推荐算法是Match与Rank的联动协同。当用户Match模型，召回的内容较少时，Rank排序则无较大的发挥空间。当用户的行为丰富，更容易获取召回了，Rank排序则能发挥更大的效用。

#专栏作家#

Link，微信公众号：从0到1（aboutlink），人人都是产品经理专栏作家。美团点评产品经理，负责亿级用户平台，专注于O2O，用户产品设计，数据分析等领域。

本文原创发布于人人都是产品经理。未经许可，禁止转载。

题图来自unsplash，基于CC0协议

更多精彩内容，请关注人人都是产品经理微信公众号或下载App

Link

阿里巴巴产品经理，微信号：从0到1

45篇作品 841945总阅读量

大厂SaaS平台的7个真相

06-055552 浏览

大厂SaaS平台的7个真相

WMS—盘点功能设计

02-1216750 浏览

WMS—盘点功能设计

重启天涯直播：最高观看不到1000人，情怀难抵现实，关键是重启后怎么办？

05-303907 浏览

重启天涯直播：最高观看不到1000人，情怀难抵现实，关键是重启后怎么办？

汽车品牌APP车控模块调研及功能设计建议

10-168642 浏览

汽车品牌APP车控模块调研及功能设计建议

产品经理职业规划

10-3110279 浏览

产品经理职业规划

评论

大卫

这也太空洞的吧

最近来自广东回复
北方有虾人

看不懂能说吗

最近来自湖北回复

网红基金失宠，年轻人花式“搞钱”

08-151545 浏览
从“进淄赶烤”到“进津赶跳”，天津为什么没成为下一个淄博？

09-123757 浏览
二手“套现”生意，年轻人新舞台

03-073174 浏览