B站的推荐算法机制大揭秘!

1 评论 7561 浏览 55 收藏 7 分钟

本篇文章以2023年5月最新公开的两份b站推荐算法为例,具体分析其中的两大算法:安全算法和推荐算法。作者对这两种算法进行简单举例,方便读者理解。希望能对你有一定的参考帮助。

最近,有塘友让挖塘人分享一下B站的推荐算法,今天就来详细说一说。

B站的推荐算法机制大揭秘!

如今,b站已经是不再是之前的那个二次元内容网站了,它现在被称为「中国版的YouTube」,流量和用户近几年上涨很快,内容也在不断地向多元化发展。

从创作者或者商家的角度来看,它是一块香甜的流量蛋糕,但要想吃到这块蛋糕,还是需要方法和技巧的。下面挖塘人就给大家捋捋B站的内容推荐算法机制。

在正文开始之前,我们说两个事实:

1)算法不断更新

其实,b站的运营方法和机制在几年前挖塘人就分享过,但现在回过头看,变化太多了。

所以我们需要明白一个事实:那就是各个平台的智能算法都会不断更新,不断地完善。大家不要想着「一成不变」,更不能使用远古的运营方法来运营现在的平台,必须与时俱进。

当然,挖塘人也会及时给大家分享各平台的动态。

2)算法不是玄学

很多人看平台推荐算法的文章都是别人加工后的或者说根据自己的经验猜的,但看的人传来传去就变成了玄学。

其实,算法不是玄学。它是有依据,有数据指标的,以2023年5月最新公开的两份b站推荐算法为例,它里面就明确说了很多具体的数据指标。

B站的推荐算法机制大揭秘!

下面,我们来说说,这两份b站算法报告具体包含了哪些数据指标和运行原理:

一、安全算法

很多人以为作品发布后就会进入系统的推荐池。其实不然,作品发布后首先是被安全算法过一遍,安全算法或者叫过滤算法是各大ugc平台都有的一种算法,它的目的就是识别不符合要求的内容。

根据哔哩哔哩内容安全算法公开的内容介绍,安全算法主要包含三个部分:

  1. 内容理解模块,它是负责内容识别的模型。
  2. 运营工具,这个主要是方便平台的维护,可以通过某个特性批量识别某些内容,比如要屏蔽某个劣迹艺人,运营人员可以在数据库里操作就可以了。
  3. 训练模块,这个属于给算法喂数据的环节,它会让安全算法越来越完善,这也是我们上面说的算法会不断更新。

B站的推荐算法机制大揭秘!

那么具体有哪些内容不能通过安全算法呢?

这个在b站的社区中心里都说的很明白,对于一些比较突发的或者平台临时在数据库加的规则,平台也会作出对应的说明。

二、推荐算法

通过安全算法,只要不违规都可以,但要玩转推荐算法就没有那么容易了,因为它的影响因素太多了,而且逻辑也多。

首先,公示的算法机制机理内容明确提到影响一个作品的数据指标有作品的播放量、点赞、投币、收藏、关注以及分享等正向因素,还有点踩、不感兴趣等负向因素。

其次,把这些作品通过上述数据指标会对一批内容进行综合排序,但并不是排完序就直接展示给用户。它还需经过去重、打散等处理环节,最后再输出最终的排序并展示给用户。

B站的推荐算法机制大揭秘!

按照上面的解释,大家可能看不懂,这里挖塘人画了一张图来帮助大家理解:

B站的推荐算法机制大揭秘!

其中有两个主要的信息需要我们重视,一个是作品的互动数据,另一个是作品的权重。

1. 互动数据

算法说明里面提到两个方向的因素,即正反向因素。如果正向因素好,作品的推荐流量就好越多;反之就会减少推荐。

2. 作品权重

算法里的去重和打散等处理其实是在给入围的作品进行加权排序,它是通过各种系数计算得出的结果。

比如有ABCD四个账号分别发布了作品abcd,这四个账号的权重分别为1、2、2、1,作品的综合排序权重为2、3、2、1。

而根据加权公式:

最终排序权重=作品权重*0.8+账号权重*0.2

我们可以得出以下结果:

B站的推荐算法机制大揭秘!

所以展示给用户的顺序为bcad。

当然,这里只是为了方便大家理解举的一个例子。b站的实际加权公式要更复杂,而我们可以操作的是加强作品的互动数据和账号权重,这样不管平台的加权公式是怎样的,我们的数据都可以尽量得到最大值。

以上就是今天的内容,希望对你有帮助。

作者:挖塘人,微信公众号:挖塘人

本文由 @挖塘人 原创发布于人人都是产品经理。未经许可,禁止转载

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. B站排序中,考虑不同维度因子的正负向倾向是什么意思呢

    来自北京 回复