作者评分模型:刺激用户,获取高质量内容
对于一个资讯平台来说,优质内容是核心中的核心。笔者就通过分析两个评分模型成功案例,说明了数据模型的效果与重要性,向我们介绍一个可以刺激用户,源源不断提供高质量内容的模型——作者评分模型。
如果将平台比喻成病人,我们为“病人”诊断、治疗有以下几种方式:
- 打点滴——渠道拉新:疗效快,立竿见影,能够保证新流量入驻,不但可以增加DAU,同时能带动各业务线数据增长。
- 吃药——用户运营:见效慢,以调理为主,提升用户留存,增加用户粘性,从而提高转化率。
- 手术——内容运营:根除病症,真正做到强身健体,内容强则平台强。
而对于一个资讯平台来说,优质内容是核心中的核心。
今天就向大家介绍一个可以刺激用户,源源不断提供高质量内容的模型——作者评分模型。
在做模型之前,咱们要想清楚一个问题,作者评分模型是干什么用的?
如果只是为了给用户打分而打分的话,大可不必做这么复杂的模型,最原始暴力的看PV和UV就可以解决了。我个人理解,作者评分模型分以下几个作用:
- 综合评价作者(自媒体)
- 激励作者输出更多更好的作品
- 针对作者不同属性,精细化运营
仅从文章消费角度的PV和UV来认定一个作者的好坏,是一种很片面的做法,因为有些“标题党”会得到更高的分数。
可以试想一下,标题为《二手特斯拉仅需20万》的文章,对于想买车的读者来说诱惑力有多大。
但读者点进去,往下拉,再拉,拉到底下也没看到在哪里能够买到20万的特斯拉,读者一脸黑人问号的同时,有抄起板砖拍作者的冲动——这就是典型的标题党。
若仅从PV、UV角度来看,也显得不那么公平,但如果加上新增粉丝数、点赞数、完度率、评论数等因素综合评估的话,那么标题党就不会那么吃香了。再加上反作弊指标,作弊刷量作者便无处遁形。
在讲模型之前,我们通过两个家喻户晓的游戏(评分模型成功案例),来分析如何刺激用户提供更多、更高质量的游戏(作品)。
下图和平精英(刺激战场)及王者荣耀总览图,红框部分为某用户该赛季的排名或评分。
和平精英总览图
王者荣耀总览图
两款游戏的赛季排名以百分比的形式展现,并附有段位的划分和队友点赞等,能够激励玩家不断提升自我。
马斯洛需求层次理论的金字塔的倒数第二层便是尊重,每个人都希望自己努力的成就被别人认可,在尊重得到满足后,便使人充满对某件事物的信心,进入良性循环,从而享受在某一领域独特的价值。
我相信当有人说我这哥们是王者,全服前1%的时候,应该是最满足的时刻。
和平精英详细数据图
王者荣耀详细数据图
如果说总览图是让用户一眼能够看出好坏,那么详细数据就是要告诉用户哪些方面可以提高。这样一来用户可以对症下药,提升质量。
在游戏里中体现的是更多玩家打出质量局,若在作者体系中,就是输出更高质量的文章。由以上两个游戏案列,我们引出今天的主题——作者评分模型。
一、模型概述
我先把成品给大家展示一下,让大家对这个模型有个初步印象,接下来再具体讲解细节。
作者评分总览图一
作者评分总览图二
简单的讲,模型是通过算法页的不同变量(指标),对作者进行标准化打分,再根据各项指标不同的权重,汇总一个总得分,各项指标可以向下拆分一级、二级或更多级指标。
在样例模型中:
作者总得分=质量得分*权重1+互动得分*权重2+消费得分*权重3+发布得分*权重4+附加项得分*权重5
有人会问,影响力得分为什么要用开根号乘以100呢,我们先来看一下开根号乘以10,如下图所示:
令f(x)=sqrt(x)*10,(0≤x≤100),x为作者总得分,把x经过f映射后,好处有以下几点:
(1)f(x)是单调上升的,映射后仍保留原序,保证了公平公正
(2)f(36)=60,及格万岁!
(3)f(x)为凸函数,原分数越低,得到的补偿分数越高如上图,原始分数在20分时奖励25,原始在60分时奖励17分,而80分时只奖励9分。
大家应该恍然大明白了,这么做主要以积极鼓励作者为目的,同时也不改变全局排序,最后在乘10的基础上稍作改动乘以100没有别的意思,就是显得分数更多而已。
欲问我为什么知道此“大法”,要追溯到高中时期的化学期末考试,当时的我惨目忍睹得考了49分,本以为要补考的我,最终被开根号乘10大法拯救,以至于没有完全放弃对化学这门课程,拿到最终分数的我大喊了一句“开根大法好”!
二、模型算法
纳入评级库标准
(1)所有媒体库中的作者
(2)数据异常无法获取正确信息的作者不参与评分
打分方法
(1)各项一级指标、二级指标在0到100分范围内打分,无及格分数线。
(2)对于可获取数据的定量指标,采用标准化的方式打分;若数据量级相差较大,可以先取对数,再进行标准化(减小量级差异造成的影响)。
以文章浏览得分为例:
其中,
(3)附加项加分,正向指标,如个别数值表现突出,超过预设值的5倍,则给与额外加分,比如点赞数预设上限值为800,当有作者得到4000以上的点赞时,我们会考虑额外加分。
(4)附加项减分,反向指标,当发现有作者作弊时,情节轻者扣分警告,恶劣者删除作者号。作弊可通过第三方软件和算法识别出来,反作弊反欺诈会在今后单独写一篇文章介绍,下面只是简单的介绍一下作弊的类型。
- 用户IP异常,包括请求次数与地域异常
- 手机设备被篡改或者安装高危软件
- 存在一个账号多个设备,或者一个设备多个账号
- 特定时间,访问量出现激增情况
不要小看作弊这件事,这会严重影响体系的平衡性,质量差的文章通过刷量占据TOP榜,那么推荐算法就会增加该文章曝光度,读者便会看到低质量的文章,久而久之,会造成作者与读者的流失。
权重确立方法:层次分析法(AHP)
层次分析法是一种常见的权重分配法,这里就不多赘述了,想了解AHP算法的朋友可以看一下本人的另一篇文章《如何用更少的钱,带来更优质的量?渠道质量评估模型|一文通透》,在网上也可以找到免费的层次分析法软件,非常实用。
简单的概括AHP层次分析法,就是用科学的方法确定权重,拒绝“拍脑袋大法”。这样便有了如下图,一级指标权重。
一级指标图
二&三级指标筛选(聚类)
1. 盲选:将根据经验得到的、现有的备选聚类变量全部纳入模型,暂时不考虑某些变量是否合适。
2. 贡献量分析:通过方差分析,观察分类是否存在显著差异,踢出对模型聚类没有贡献的变量。
3. 相似矩阵分析:输出相似性矩阵,对相关系数进行分析,若两变量相关系数接近1,说明两个变量可以互相替代,踢出一个变量以达到降维目的。
4. 通过上述3步对变量进行筛选,既能踢出贡献度较低变量,又将相关性强的变量进行整合,最终输出相互间属性独立的变量。各项二、三级指标的权重也参照一级指标一样,层次分析法进行权重分配,最终得到指标骨架图,如下图所示。
模型指标骨架
模型指标骨架图
骨架填充与BI展示
将数据填充到骨架中,再按照自己想看的维度去做相应的BI展示,本文按周和月对作者进行评级,也可以按照日为维度进行监控。接下来的第三章讲解模型的应用。
三、模型的应用
这一环节主要介绍模型的应用。
俗话说得好,不能将模型落地执行的需求都是在耍流氓。
模型好么?好!怎么用?不会!那就是一种资源浪费,数据分析师的价值就是用数据推动业务。废话不多说,来看一下模型如何应用。
应用场景一 排名奖励促生产
每月对影响力进行排名,根据排名TOP100的自媒体和用户,按照排名梯度给予额外奖励,刺激用户多发文章,发好文章。
应用场景二 热度征稿奖励
除了一些自由文章外,还需要做活动引导作者发表热门文章,比如以“国五国六排放标准的汽车如何选择”为主题的文章,贴合现阶段市场行情,更容易吸引用户的眼球;
还有类似新车抢先评测奖励,在大多数人还处在购车犹豫阶段,一篇新车抢先报可以解答用户的疑难杂症。
文章写出来,我们便可通过模型对用户进行综合评价,避免标题党的情况出现,同时作者也会获得模型加分项的加分和活动的双重奖励,促使作者输出读者想要的热门文章。
应用场景三 裂变拉新
文章还能拉新?
当然能!
其实这里面就用到了互动得分,将模型里互动得分高的文章筛选出来,作为裂变的种子,通过种子用户进行传播,达到裂变拉新的效果。
应用场景四
Know your customer,知道你所运营的作者是啥属性,一般一个内容运营手底下有许多作者,根据模型判断。
如果作者属于“沉默是金”类型,出品频率虽低,但只要出品必属精品,那就引导作者提高频率或者转变热门话题。
若属于高频低质量的“口水文”,那么有必要来一波质量提升。如果是作弊用户,那就“拜拜了您内,不送!”该应用主要是针对作者属性,精细化运营。
此模型的优势之处在于综合评估作者,而且还能将作弊之人“绳之以法”,在了解你的作者和读者基础上运营,必将事半功倍。实际上,该模型的玩法还很多,我们等待更多内容运营大神脑暴,以发挥模型最大价值。
四、模型的拓展
该模型不只局限于作者评分,还可以做渠道评估、活动评估、用户质量评估、用户积分评级系统等等。把相应的指标替换,赋予相应权重,便可套用此模型。
渠道评分模型
用户评分示例
至此,整个模型流程已经介绍完毕,后续还有多种分析方法以及策略,在这里只是抛砖引玉,就不多赘述了。最后我们就把今天分析的过程捋一捋:
流程鱼骨图
- 模型确立
- 纳入数据库标准确立
- 打分标准确立
- 权重计算
- 变量指标筛选与调试
- 结果展示
- 运营并制定策略
今天给大家介绍的作者评分模型就到这里,文章里埋了个伏笔,就是用户反作弊反欺诈。
互联网的作弊行为还是相当严重的,如果无法排除这些用户及其行为,会给模型、运营策略等造成很大的负面影响,错误的数据、高效的执行便是灾难。今后会和大家分享反作弊心得,敬请期待。
写在后面:希望这篇文章可以帮助广大的运营人士,也能够让用户了解平台运营方式,同时欢迎同行与爱好者一起交流学习,提出您宝贵的意见。
作者:姜頔。硕士毕业于日本早稻田大学,前人人贷高级数据分析师,现易车网数据分析专家。主要负责数据运营和用户增长。
本文由 @姜頔 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议
对我目前的工作指导意义很大 感谢作者!
请问你看工作机会吗?
写的不错。 想问下模型最后算出的综合评分,最后是动态的,你是怎么测试校验是否正确的?是否是符合当前场景下的综合评分呢?
文章里的发布得分,是指发布时间吗
文章介绍是发布的数量,不同类型还可以不同分数
求一个联系方式啊,之前关注了你鸟哥但是不能够私聊加
求一个联系方式啊,之前关注了你鸟哥但是不能够私聊加
开根号大法能够在不影响函数性质的状态下,让增长速率变小,这一步是很巧妙的。
对的,更能照顾分值低的作者,避免低分打击作者积极性~~
可以和您申请加个微信么
没搜到哦~~~~
谢谢,非常实用
谢谢您得肯定~.~
关注了,非常有价值
谢谢您的肯定
确实很受用,阅读完之后收益良多。如果可以,希望您可以产出一篇文章,就是说明在不同的场景下适用于怎样的推荐算法,这是我的一个请求。十分不好意思。
好的,我会考虑加到后面的文章里,敬请期待~~
十分感谢您了,做产品快两年了,十分期待您的“干货”!
之前你写的几篇现金贷的文章看不到了呀?想再次拜读一下
网贷之家里可以还能搜索到
这个开根大法真是实用,避免给作者打分过低,影响作者积极性
是的~~尽量以鼓励为主,但又能保证整体排名不变
nice。 😈 第1个收藏的是我。
😉 😉 😉