继纯银视奸渣浪之后,我们来详聊微博feed流算法问题
继纯银视奸渣浪之后,本文作者作为从业者+PM,对于微博feed流算法问题,也谈了一些自己的看法。
不得不感叹,在微博清一色被各类大号“林丹出轨”跟风式的刷屏之后,果然我大互联网行业依旧迸发着阵阵清流,一片欣欣向荣。
其中,以纯银为典范,笔耕不辍。昨天一时兴起又聊起了微博算法的问题。视奸渣浪的feed流算法 如此敬业,对于“互联网欠他一个成功”的说法我至此深信不疑。
好了,话不多说,既然话题抛出来了,作为从业者+PM,也谈一些自己的看法。
其实,纯银谈论的核心内容很简单,采用大白话式的普及贴,相对于不那么晦涩,也有利于各年龄段的用户理解,但确实有点浅尝辄止。
回顾昨天纯银的文章,几句话来概括一下:
- 微博对部分营销号做了标记,对内容推送做了限制,方式是先灰度测试,根据效果扩大范围;
- 对普通用户的部分行为做了降权,比如长图,转发等;
- 微博开启了信息流优化,打乱了时间序,增加了未读池。
微博打乱 time line 的必要性
纯银提到,微博大概分为两个阶段,对蓝V、营销微博和普通用户特定内容进行限制分发。事实上,降低低质量的互动内容,恶意营销行为,进一步提升优质内容在站内的传播曝光,一直是微博在优化的方向。
但为什么要特别强调营销号和大V呢?是基于产品属性而言。对于微博来讲,社交关系链(“关注”的设计)无疑是产品的核心,内容的传播也是依靠关系链的节点做分发和过滤。而微博在其媒体属性的辅助下,”fellow”关系的影响愈演愈烈。
营销号和大V无疑是微博的头部用户,是所谓的利益所得者。一方面他们掌握站内的流量分配权,占据着绝大多数用户的互动时间,无疑提高了新的内容生产者获得流量的机会成本,降低了传播低质内容的成本。
仅仅是微博面临这种问题吗?当然不,微信也有类似“意见领袖”。所以微信也出台了折叠订阅号,限制外链和遏制H5在朋友圈传播等种种措施,规避社交分发机制带来的弊端。
至于灰度测试内容推送,根据效果进一步扩大传播范围,并不能单纯理解上是打压。 因为或许在微博看来,只是把它当做优化信息分发的方式,以减少由于单一账号短时间内,多频次产生内容带来的“效果折扣”而已。
不太理解纯银所讲的,被“未读内容池”逐渐取代,是何种意思。因为他并不是“未读内容池”推出之前微博的低级解决方式,况且此种策略,不仅仅局限于营销号和蓝v,它至今依旧存在于微博的内容生态之中。
况且, 微博亦可以通过标签词挖掘、用户影响力判定,通过聚类、关联等相关算法进行聚合,构建分类模型识别出来,无需其所说的折腾得要死的方式,人工梳理、标记。
说的再明白点,即便微博回归 feed按照time line的排序方式,统一时间维度内,订阅PO主产生的所有内容也并不是都会刷新出来。(微博M站貌似依旧可以按照时间序)
微博有没有对普通用户降权的说法
大多数情况下,微博用户被降权,是指系统会通过一系列在线分析策略(包括发布频率、文本分析、用户行为、账号可信度查验等),系统根据会判断结果,作出对应的处理动作,比如删除内容、限制行为等。
但对于类似内容含有敏感字等进行处理,视为某一阶段微博对用户降权,说法是非常不严谨的,应属于反 spam 的范畴。
唯一能够查到的是,微博确实赋予了头条文章最高的权重,默认按照热门微博排序。背后的出发点是微博需要打造原创内容生产平台,促进自媒体商业形态的形成,属于战略和业务驱动。
而假想之中的转发被降权,是微博引入不同权重因子,推导出相应的衰减公式,并通过衰减效果的对比,逐步确定了相关衰减参数的数值,最终得出了不同用户内容权重的时间衰减函数,而动态调整排序,一般被运用在热门微博和找人的场景。
由于微博调整了算法规则,打乱了时间轴,所以,理论上会出现内容权重随时间衰减导致排序调整的情况, 但绝对不是纯银列举的那么简单。
新浪微博列表页
微博演变过程运用到了哪些产品策略
之前已经提到过,社交分发机制在内容平台中,存在种种不完美的现象。所以,为了打破社交等级分化带来的头部用户滥用流量分配,就必须建立新的算法过滤机制和规则。
很早的时候,大概两三年之前,微博就已经在尝试,根据用户的关注、兴趣、文本等信息,对相关内容进行合并,依据兴趣、热度等维度对内容进行“智能排序”。
曾经在很长的一个周期内,微博用户只依赖于关注等强用户行为操作(关注或热门微博搜索),而产生内容的阅读、消耗,再传播的机会,为了不至于刷不出来内容,渣浪也使用了作弊手段。是不是大家都会或多或少的感觉,“渣浪又给关注了莫名其妙的人!” (现在的动机,更多是商业化的考量)
有限的产品损耗,是为了满足产品的核心价值。
之后,随着内容几何级的递增,微博逐步将算法融入其社交分发机制,推出了多条产品策略:
- 增加了互动朋友的行为动作提示,比如朋友互动过的内容,朋友新的关注好友操作,并提升好友分享过新闻的权重;
- 在时间流的顶部呈现用户错过相关性大的微博;
- 基于用户自主设置,提升特别关心人的微博权重(微博头条就不算了,付费项目)
- 检测用户近期互动行为的相似性,对关注的人,互动性频繁的好友,优先分发,提升互动行为;
- 小范围内尝试打乱时间线,根据相关性和兴趣组织内容。
所以可以看出来,微博正在结合用户的社交关系以和算法对于对信息的二次过滤来确立内容的组织方式。
这也就验证了,微博打乱Time line 的终极目标,不在于是否用户错过了有价值的微博,也不是关心单位时间内用户刷不刷得到新的内容,而是解决在内容过载的背景下,潜在优质内容的分发问题。
(而纯银的表述给我的理解是,微博是在解决,没有内容刷或优质内容错过了看不看得到的问题,我理解是用户在使用期间内,微博应该解决让用户看什么的问题,这本质上是两个问题。)
建立在如此论据下,微博依据某一时间内,内容的冷却衰减公式,结合互动行为,重新定义内容的排序方式,增加了未读优质内容曝光的机会,是比较容易营造出“未读内容池”(看过+没看过内容)的直观感受。
@来去之间 曾经也提到了他的担忧:
互动行为增速没有用户规模增速快,主要还是信息流内容增速太快,比如你关注了100人,可能你每天阅读的信息和您收到的信息大概是十分之一不到,这是一个核心的问题。比如像央视新闻这样的账号,内容发的太多太快,普通用户发的内容被稀释的越来越厉害了,这种稀释对普通用户来说是不利的。
最后,个人表示非常认同纯银的某些观点:
- 微博调整算法排序后的时效问题。对于微博的定位,倾向于它是“基于兴趣的社交媒体平台” ,与FB式的设定仍有细微区别。部分用户也是将它作为新闻客户端的替代品去看的,所以时效非常重要,错乱的时间序有点炒冷饭的味道,有损内容的价值。
- 调整后会提升微博的阅读量和互动行为,制造更多令人发指的商业变现场景。
当然,也有不认同的,比如这句:
从产品专业的角度来讲,当feed流速到了某一个地步,用算法来优化内容构成就是一件不可避免的事情,挨骂也是一件不可避免的事情。
诺,看看微信朋友圈,多克制。
本文由 @钱熠辰Mlio 原创发布于人人都是产品经理。未经许可,禁止转载。
写成这样程序员大哥可能还得拉你过来让你用大白话解释一遍~
看不懂~
👿 说实话,这篇好水。。。写的都什么玩意????????
“而是解决在内容过载的背景下,潜在优质内容的分发问题”这个是汇报时候用的术语。大多数团队和产品在做这个改进时,做的就是纯银描述的那么浅显易懂。
叫微博的技术来写点干货吧!