公众号“乱序”猜想

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

发布

游牧志

2021-01-18

2 评论 10653 浏览 18 收藏

14 分钟

编辑导语：从2018年开始，微信公众号陆续推出订阅号“信息流”改版，文章推送排序也从之前的按照发布时间变成了根据订阅号的优质程度、用户对订阅号的喜爱程度以及群发文章的内容质量等综合因素动态变化。本文作者基于公众号“乱序”推送，对微信公众号存在的问题展开了分析讨论，并对其“乱序”设计分享了自己的几点看法，希望能够给你带来一定的启发。

最近在看《内容算法》，一本有关内容推荐的入门书，前今日头条产品经理闫泽华写的。

书不厚，但干货不少，既解答了我此前对于头条号、豆瓣、知乎等内容平台部分功能设计的疑问，也给我关于公众号“乱序”（官方称之为公众号智能推荐）的思考提供了一个解题方向。

01 公众号此前存在的两个问题

1. 内容重复

内容重复是内容生态大繁荣的伴生问题，是所有内容平台发展到一定阶段的通病，非公众号一家独有。

一个热点事件发生后，权威新闻源（比如人民日报，城市官媒等）会发布新闻通告，自媒体会从不同角度进行评论，营销号会批量产出蹭热点的内容。所以我们之前经常会在订阅号列表里看到，“n屏都是看了标题就不想点进去的内容”。

一篇优质文章（尤其是爆文）诞生后，大量账号也会加入转载行列。比如“得到”公众号发布罗振宇2021“时间的朋友”跨年演讲全文后，在我关注的公众号中，包括但不限于“罗辑思维”、“笔记侠”、“腾讯科技”、“深燃”等都进行了转载，有的是标题、封面、描述不做修改的转载，有的是调整其中一个或多个元素的转载（之所以强调这一点，是因为它涉及到内容推荐优化的一个逻辑，第二部分会细讲）。

大家来看一个数据，新榜1月9日发布的：据新榜日常监测的162万微信公众号样本数据显示，2020一整年，公众号发文总篇数超过了3.87亿，其中标注原创篇数为2289万篇，占比为5.92%。

2289万篇文章，其中有多少比例是转载的，这份成绩单里没写。

不过，我们可以从新榜2017年的数据略窥一二：2017年原创文章占比4.6%（略低于5.92%），其中11月标记转载和原创的比例是3:1，也就是说，平均每1篇原创内容被转载3次。

要知道，这数据还是平均过后的，大号每篇文章被转载的真实数据往往都是几十几百的，而且好的文章会在各个大号中互转，内容重复展现是比较寻常的。

2. 内容“折叠”

这里的内容“折叠”，不单指公众号次条以下被真实折叠了的文章，还包括那些出于各种原因没被读者读到的文章。

因为职业需要，我关注了各种各样的订阅号，数量有点多，1071个。所以我的订阅号消息列表每天都会很热闹，有好几百条更新。不过，我获取一次性消息的对象条数是有限的，一般是两位数。也就是说，很大一部分内容是没有被自己看到的。

这不是个例。

据微信团队统计，在严格的时间排序下，用户在消息列表看到的卡片，大多其实都是完全不读的帐号，用户本身常读号的卡片，大量都没有被用户看见。

内容重复和内容“折叠”这两个内生问题，直接影响了用户的内容消费体验。长此以往，用户会大量流失，创作者会陆续出走。这样的情景绝不是微信公众平台想看到的，必须作出应对。

公众号“乱序”（智能排序）就是微信团队给出的一个解决方案，目的“是为了让用户看到更多更好看的内容。”

02“乱序”该怎么设计才合理？

那“乱序”究竟是怎么“让用户看到更多更好看的内容”的？

所谓公众号“乱序”，从表面上看，是系统在原本严格的逆序时间线里，把部分历史文章抽取出来，穿插其中（经观察，基本都是穿插在发布5分钟内的文章之后）。

这就引出大家都很关心的一个问题，系统是怎么抽取这些文章的，存在哪些策略或规则？

我们把时间拉回2018年，当时公众号刚内测按逆序时间线排序的“信息流”（行业内是这么口口相传的，尽管张小龙本人不认为这是“信息流”），知名自媒体人caoz在体验后就提出了一套可能的“信息流”设计策略：

原创指标，被认证的原创文章可以获得1小时的优先资格。
置顶指标，用户置顶的公众号，其内容可以获得8个小时的优先资格。
好友指标。如果一篇文章在近期有多个好友点赞，或多个好友转发，我认为这个应该是我会优先关注的内容。这个前提是，我已经订阅的内容。
负评指标。当负评达到一定程度，在排序的时候扣除其一定的时间资格，并基于此降低其排序和曝光量。

这套策略已经有“乱序”的影子了，其中置顶指标，有点类似目前微信团队已经公布出来的“常读用户”指标，而好友指标，很可能也是当下“乱序”策略的重要参数。可谓非常有预见性的想法了。

不过，它主要还是站在保护原创者利益的角度出发，是有局限性的。caoz自己也在文章中承认了这一点，“存在屁股决定脑袋的现象，可能不够公正和中立。”

还有一点就是，它没有解决我们前面提到的内容重复和内容“折叠”的问题。所以我在想，有没有可能引入另外一个指标：内容消费预判指标（指标名字是自己编的，思路来自《内容算法》这本书）来优化读者的阅读效率。

根据用户对内容的消费过程，我们可以将读者对内容的消费拆解为列表页消费和详情页消费。前者关系到点击前的消费预判（下图左），后者则代表了用户点击后的消费体验（下图右）。

基于这两个维度拆分，我们能够得到这样一张表格（如下图）：

三种场景分别对应了公众号内容重复的三种处理方式：

情况A（甲、乙两篇内容，详情页都相同，即转载）：

从消费者角度看，甲、乙两篇内容对用户来说是具有替代性的。用户消费了甲内容之后，大概率不需要再消费乙内容了。

那么，如果读者关注的公众号中相近时间段内发布了甲、乙两篇相同的文章，且读者已经读过甲文章了，乙文章就没必须通过“乱序”穿插到前序消息列表中；但如果读者两篇文章都没看过，系统可以根据其它维度比如原创，选择其中一篇文章进行穿插。

情况B（甲、乙两篇内容，列表页相同/相似，详情页不同，即同选题）：

前面提到，每次热点事件发生后，都会产生大量追热点或蹭热点的文章。尽管用户点击后的消费体验不同，但是相似的列表页展示（标题、封面和描述）会给用户带来消费决策上的困惑。

如果用户点击过了甲内容，他很有可能会认为乙内容和甲内容是重复的，或者并不想在当下密集地看到相似内容，从而忽略/错过了乙内容。对于乙内容来说，这会导致曝光减少。对于这种情况，应该拉长两篇内容的展示间隔，通过呈现顺序的改变，将相似的内容分散开，从而避免用户视觉疲劳。

当然，这里的拉长依然遵循当下的“乱序”规则，不是指在发布后的5分钟内。

情况C（甲、乙两篇内容，列表页和详情页都不同）：

这种情况是最简单的，两篇完全不同的内容，互相不构成对用户消费预判的影响，从其它维度进行“乱序”排列即可。

最后，来聊聊官方已经公开的另一个指标，即时效性指标。

公众号“乱序”功能上线后，一些对时间敏感的用户比如我们做媒体要求新闻时效性，就会很不习惯。对于这一点，微信团队在接受知晓程序采访时透露，“我们的团队也在加紧对时效性的问题进行更新，我们不是让时效性的文章一定会出现在所有用户的第一位，我们会通过算法调节，让喜欢看时效性文章的用户，他的时效性文章能够更快地排到前面去。”

这段话大有深意，不仅直接表达了时效性指标的存在，也间接说明了公众号完全可以根据我们的内容消费标签，实现相对精准的内容排序展示。

注：以上仅代表自己对公众号“乱序”的猜想，不代表当下公众号“乱序”的真实算法。