功能解析:今日头条评论功能调研及思考
文章对今日头条评论功能展开了较为系统的分析,希望通过本文能够给你一些启发与思考。
1.今日头条评论功能简介
评论功能置于信息流内容框架中,主要为了丰富文章、图文、视频等信息流内容形式,增强内容与用户的互动性,方便传播。并通过评论的不断叠加增强信息流内容的话题性与内容热度,利用评论内容作为载体连接用户与用户,增强关注、粉丝等社交行为。
1.1评论功能位置
1.1.1视频信息
点击进入视频信息中后,视频信息中评论区位于广告栏下方,瀑布流显示。
1.1.2图文信息
点击进入图文信息中后,图文信息中的评论区位于推荐阅读栏下方,瀑布流形式显示。
1.1.3图集信息
点击进入图集信息中后,浏览图集信息中的评论区需先点击评论icon按钮,进入评论页面。同样为瀑布流形式。
1.1.4总结:
1.2评论功能用户角色
用户:评论内容的主体生产者,前提需要信息流内容做支撑,并激起用户评论欲望。
用户权责:发起评论,引用/回复他人评论,删除自身评论。
内容创作者:作为评论载体的信息流内容的生产者,对评论拥有初始的置顶权,权重等级高的内容创作者可以对评论进行删除、屏蔽、筛选权。
用户权责:置顶评论,引用回复他人评论,删除、屏蔽、筛选展示评论。
平台:评论内容的主导者与审核者。对评论内容有着最高的筛选、排序、审核权。
用户权责:对评论内容有着最高的筛选、排序、审核权。审核权与排序权为平台独有的权力。
1.3评论内容框架
- 用户头像区:展示评论生产者用户头像的区域;
- 用户ID区:展示评论生产者ID;
- 评论内容区:展示评论主体内容;无字数限制;
- 评论时间区:展示评论发布时间;
- 点赞数:展示评论倍其他用户点赞的数量累加和;、
2.平台评论排序策略
2.1简介
主要调研今日头条平台对信息流内评论信息瀑布流的排序优化策略。排序优化策略的主要为在不同的信息内容孵化周期,根据不同的参数进行相应的策略调整。
2.2相关参数
发布时间:单条评论的发布时间,精确到分钟。
评论内容字数:指评论内容的总长度,即字数总合。
点赞数:单条评论被其他用户点赞的总次数和。
用户活跃度:发布该评论的用户在平台内的活跃度,以关注量、粉丝量、使用频率、单次使用时长等评估与判断。
2.3评论孵化周期
2.3.1冷启动期
图文信息、视频、图集信息刚刚发布30-60min内,评论数小于10条,且无被点赞评论,或被点赞评论数较少。
在冷启动期,因为相关参数并没有完全展现,展示策略默认将被点赞数、评论字数确定为首要指标。
单条评论点赞数越高,排序越靠前。点赞数越低,排序越靠后。
除了被点赞数,评论内容长度被确定为主要指标。评论内容字数越多的,被放在首位,其他评论按照内容字数多少顺次排列。
若存在点赞数与评论内容长度相似的多条评论,优先侧重评论内容长度指标。即点赞数相同,将评论内容长度更长的排列在前面。
总之,排序的最终结果由点赞数与评论字数的综合表现来决定。
发布时间被确定为重要性最低的指标,不被评论排序策略所引用。
2.3.2活跃期
图文信息、视频、图集信息刚刚发布30-60min内,评论数大于10条,小于200条(根据实际情况而定,以达到评论上升速度峰值为准),存在多条被点赞评论。
在评论孵化成熟期,可以应用于评论展示策略的指标类型多了起来。
被回复数,点赞数,评论内容长度,用户活跃度,用户关注、粉丝数被作为参考指标。
下表为对11条评论几大参考指标的统计:
通过对11条评论的几大参考指标的统计,排序优先权重值进行估算。
权重值=(评论字数*点赞数)+(关注数+15)*(关注/粉丝值+0.1)*10%+被回复数*15
以上推算并不准确,但可以大致上推测出评论排序的参考指标优先级:
评论字数>被回复数>点赞数>用户活跃度/用户关注、粉丝数。
2.3.3成熟期
图文信息、视频、图集信息刚刚发布60min以上,评论数大于100条且增加速度趋于稳定,被点赞、回复的评论占比很高。
被回复数,点赞数,评论内容长度,用户活跃度,用户关注、粉丝数、以及评论发布时间都将被作为参考指标。评论排序策略可应用的数据指标更加丰富。
对189条评论的前20条评论信息各项指标进行分析比对,发现随机性非常强。
推测此时评论显示排列策略不在考察各项数据指标,可能是利用评论分词处理后,与文章标签做比对哦,或算法筛选出用户更想看到的评论内容,或能够引起用户共鸣的评论前置。
结合头条的理念就是应该把用户“想看的评论”展示给用户,最好是能做到“你看到的就是你想说的”。头条在对评论进行排序的时候可能考虑了以下几点:
- 让评论的排序也“千人千面”,用户最先看到的评论应该是用户最感兴趣的;
- 要实现第1点,头条可以根据评论得到的赞的个数和评论者和阅读用户的相似程度,给评论赋予不同的排序权重;
在这一点上,很多之前的分析文章都会把评论排序盲目的分类,比如按照赞的多少,按照发布时间,顺序倒序等等。但实际上,目前用户量相对比较大的新闻、门户、聚合信息平台,都已经应用了最新的评论排序算法。
说到这里就不得不提高reddit,这款国外鼎鼎大名的新闻社交产品。他的评论排序策略重新定义了产品的评论区。
Reddit评论排序分析
“Best”排序
有人对评论like,则数据库会进行采集,评论越多,like的越多,则机器越能精确判定该评论的排名。通过对精确程度的量化,从用户的like中尽可能推算出评论真实质量。
机器从like与dislike数据库中抽样统计,计算出置信区间,我们第一步对这些区间进行排名,这个暂时排名比较的是这些评论最终排名100在一百次统计中95次可能落在的区间。
对于抽样数据需要在数量上有保证,不然系统仍然会将其排在低位。
10like+1dislike are better than 50like+25dislike. 前者会排在后者前面,通过概率计算结果来推算。
但问题是,Reddit的评论排序策略虽然可以有效的筛选出用户喜欢的评论,但对时间参数的过度重视,依然会让其他用户只将关注焦点放在最新的评论上,使得评论的长尾越来越长。
但回顾评论排序的算法历史,几乎都经历过按照发布时间到按照赞数,再到综合时间与赞数,再到现在综合多个参数进行综合考量。但其实回归本质及需求,都是为了解决下面这些问题:
- 赞数多的评论只是迎合了大部分用户的偏好,而没实际意义。
- 排名高的评论与文章并不相关,但因为一些手段和马太效应,更好的回答没得到足够的展示机会,于是被埋没。
- 有争议的问题,很难明确怎样的排序是公平的。
其实可以用作权重factor的无非以下几种,被回复数,点赞数,评论内容长度,用户活跃度,用户关注、粉丝数、以及评论发布时间。如何合理分配权重,是每个平台都会面对的问题,各自也有自己的策略。主要分为以下三个维度:
3.几点思考
除了今日头条之外的其他平台,可能将权重factor更加侧重于在信息维度,即评论字数,即评论相关度。但通过对头条评论排序靠前的用户的分析,我认为头条将权重factor更加侧重在了用户维度与社交维度。
首先,在社交维度上,被回复数高的评论拥有更高的排序权重,因为这样的评论能够激发话题,启动用户之间的互动。与此相比,被点赞数成了次级别的权重factor。因为确实存在这样的评论,用户点赞几千条,但是被回复数寥寥无几。
能够引起用户激烈互动行为的评论一定是好评论,但不是所有的好评论都能激发用户的讨论行为。
其次,在用户维度,头条更喜欢将那些用户活跃度高,关注量低,但是粉丝量少的用户评论排序在前面。这样的处理目的在于增加这些“潜力股”用户的忠诚度与体验,通过增加用户曝光率,让其获得关注受益以及粉丝受益。这样的处理可以抓住这些容易流失的用户,并隐性的增加其忠诚度。
就好比你非常喜欢黄子韬,经常在他的微博下面评论。你几乎每天都发,但几乎没有过任何反馈。正当你即将要放弃他,去粉其他的明星的时候,他突然回复了你的评论,或者在微博里提到了你的ID。这种体验对于追星者来说简直不要太爽,你的忠诚度被瞬间引爆。
有效的促活与留存用户,不一定需要通过精心设计的push或者运营活动,有些时候一些细节上的处理策略更能抓住人心。
由以上我们其实就可以理解,为什么头条一直有野心要进入社交领域。说到底,信息流产品的竞争壁垒非常低,无论从产品形式上还是技术上,都没有绝对的护城河。即使人们对于今日头条的算法津津乐道,但依然有人对其发表了不满。用户的标签属性量级非常非常大,且存在游动性,即使再强大的算法也没有办法预测用户个人认知的转变以及兴趣的迁移变化。
在人性面前,算法永远是冰冷的。今日头条要做的不是让每个人有信息获取的快感,而是拥有安心的归属感。
就像刚刚下飞机或者结束考试,人们打开手机的第一件事就是去看微信,而不是去打开今日头条。微信带给人的用户体验绝不是一个聊天工具,而是一个投入情感的入口。一旦一款产品让用户产生了归属感,所谓的“增长黑客”策略就显得不是那么重要了。
作者:CHinos,从传统制造业半路出家转行互联网的产品经理。公众号:chinoslab,欢迎交流
本文由 @CHinos 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自PEXELS,基于CC0协议
为什么我的头条发布评论只有自己能看到,其他人不显示呢,有人遇到这种情况吗,我研究了一下,有人说是互动插件的原因,可是我的版本里没有这个东西
超级赞
超级赞
权重值=(评论字数*点赞数)+(关注数+15)*(关注/粉丝值+0.1)*10%+被回复数*15
这个公式是反推出来的吧?我比较好奇的是,头条是怎么形成这个公式的,数值为什么设定为这几个。
这个看看就好,是我自己反推的,根本不是官方的
那这个公式里用到的系数、加减乘除是怎么推出来的呢?