作者评分模型:刺激用户,获取高质量内容

24 评论 22007 浏览 211 收藏 17 分钟

对于一个资讯平台来说,优质内容是核心中的核心。笔者就通过分析两个评分模型成功案例,说明了数据模型的效果与重要性,向我们介绍一个可以刺激用户,源源不断提供高质量内容的模型——作者评分模型。

如果将平台比喻成病人,我们为“病人”诊断、治疗有以下几种方式:

  • 打点滴——渠道拉新:疗效快,立竿见影,能够保证新流量入驻,不但可以增加DAU,同时能带动各业务线数据增长。
  • 吃药——用户运营:见效慢,以调理为主,提升用户留存,增加用户粘性,从而提高转化率。
  • 手术——内容运营:根除病症,真正做到强身健体,内容强则平台强。

而对于一个资讯平台来说,优质内容是核心中的核心。

今天就向大家介绍一个可以刺激用户,源源不断提供高质量内容的模型——作者评分模型。

在做模型之前,咱们要想清楚一个问题,作者评分模型是干什么用的?

如果只是为了给用户打分而打分的话,大可不必做这么复杂的模型,最原始暴力的看PV和UV就可以解决了。我个人理解,作者评分模型分以下几个作用:

  • 综合评价作者(自媒体)
  • 激励作者输出更多更好的作品
  • 针对作者不同属性,精细化运营

仅从文章消费角度的PV和UV来认定一个作者的好坏,是一种很片面的做法,因为有些“标题党”会得到更高的分数。

可以试想一下,标题为《二手特斯拉仅需20万》的文章,对于想买车的读者来说诱惑力有多大。

但读者点进去,往下拉,再拉,拉到底下也没看到在哪里能够买到20万的特斯拉,读者一脸黑人问号的同时,有抄起板砖拍作者的冲动——这就是典型的标题党。

若仅从PV、UV角度来看,也显得不那么公平,但如果加上新增粉丝数、点赞数、完度率、评论数等因素综合评估的话,那么标题党就不会那么吃香了。再加上反作弊指标,作弊刷量作者便无处遁形。

在讲模型之前,我们通过两个家喻户晓的游戏(评分模型成功案例),来分析如何刺激用户提供更多、更高质量的游戏(作品)。

下图和平精英(刺激战场)及王者荣耀总览图,红框部分为某用户该赛季的排名或评分。

和平精英总览图

王者荣耀总览图

两款游戏的赛季排名以百分比的形式展现,并附有段位的划分和队友点赞等,能够激励玩家不断提升自我。

马斯洛需求层次理论的金字塔的倒数第二层便是尊重,每个人都希望自己努力的成就被别人认可,在尊重得到满足后,便使人充满对某件事物的信心,进入良性循环,从而享受在某一领域独特的价值。

我相信当有人说我这哥们是王者,全服前1%的时候,应该是最满足的时刻。

和平精英详细数据图

王者荣耀详细数据图

如果说总览图是让用户一眼能够看出好坏,那么详细数据就是要告诉用户哪些方面可以提高。这样一来用户可以对症下药,提升质量。

在游戏里中体现的是更多玩家打出质量局,若在作者体系中,就是输出更高质量的文章。由以上两个游戏案列,我们引出今天的主题­­——作者评分模型。

一、模型概述

我先把成品给大家展示一下,让大家对这个模型有个初步印象,接下来再具体讲解细节。

作者评分总览图一

作者评分总览图二

简单的讲,模型是通过算法页的不同变量(指标),对作者进行标准化打分,再根据各项指标不同的权重,汇总一个总得分,各项指标可以向下拆分一级、二级或更多级指标。

在样例模型中:

作者总得分=质量得分*权重1+互动得分*权重2+消费得分*权重3+发布得分*权重4+附加项得分*权重5

有人会问,影响力得分为什么要用开根号乘以100呢,我们先来看一下开根号乘以10,如下图所示:

令f(x)=sqrt(x)*10,(0≤x≤100),x为作者总得分,把x经过f映射后,好处有以下几点:

(1)f(x)是单调上升的,映射后仍保留原序,保证了公平公正

(2)f(36)=60,及格万岁!

(3)f(x)为凸函数,原分数越低,得到的补偿分数越高如上图,原始分数在20分时奖励25,原始在60分时奖励17分,而80分时只奖励9分。

大家应该恍然大明白了,这么做主要以积极鼓励作者为目的,同时也不改变全局排序,最后在乘10的基础上稍作改动乘以100没有别的意思,就是显得分数更多而已。

欲问我为什么知道此“大法”,要追溯到高中时期的化学期末考试,当时的我惨目忍睹得考了49分,本以为要补考的我,最终被开根号乘10大法拯救,以至于没有完全放弃对化学这门课程,拿到最终分数的我大喊了一句“开根大法好”!

二、模型算法

纳入评级库标准

(1)所有媒体库中的作者

(2)数据异常无法获取正确信息的作者不参与评分

打分方法

(1)各项一级指标、二级指标在0到100分范围内打分,无及格分数线。

(2)对于可获取数据的定量指标,采用标准化的方式打分;若数据量级相差较大,可以先取对数,再进行标准化(减小量级差异造成的影响)。

以文章浏览得分为例:

其中,

(3)附加项加分,正向指标,如个别数值表现突出,超过预设值的5倍,则给与额外加分,比如点赞数预设上限值为800,当有作者得到4000以上的点赞时,我们会考虑额外加分。

(4)附加项减分,反向指标,当发现有作者作弊时,情节轻者扣分警告,恶劣者删除作者号。作弊可通过第三方软件和算法识别出来,反作弊反欺诈会在今后单独写一篇文章介绍,下面只是简单的介绍一下作弊的类型。

  1. 用户IP异常,包括请求次数与地域异常
  2. 手机设备被篡改或者安装高危软件
  3. 存在一个账号多个设备,或者一个设备多个账号
  4. 特定时间,访问量出现激增情况

不要小看作弊这件事,这会严重影响体系的平衡性,质量差的文章通过刷量占据TOP榜,那么推荐算法就会增加该文章曝光度,读者便会看到低质量的文章,久而久之,会造成作者与读者的流失。

权重确立方法:层次分析法(AHP)

层次分析法是一种常见的权重分配法,这里就不多赘述了,想了解AHP算法的朋友可以看一下本人的另一篇文章《如何用更少的钱,带来更优质的量?渠道质量评估模型|一文通透》,在网上也可以找到免费的层次分析法软件,非常实用。

简单的概括AHP层次分析法,就是用科学的方法确定权重,拒绝“拍脑袋大法”。这样便有了如下图,一级指标权重。

一级指标图

二&三级指标筛选(聚类)

1. 盲选:将根据经验得到的、现有的备选聚类变量全部纳入模型,暂时不考虑某些变量是否合适。

2. 贡献量分析:通过方差分析,观察分类是否存在显著差异,踢出对模型聚类没有贡献的变量。

3. 相似矩阵分析:输出相似性矩阵,对相关系数进行分析,若两变量相关系数接近1,说明两个变量可以互相替代,踢出一个变量以达到降维目的。

4. 通过上述3步对变量进行筛选,既能踢出贡献度较低变量,又将相关性强的变量进行整合,最终输出相互间属性独立的变量。各项二、三级指标的权重也参照一级指标一样,层次分析法进行权重分配,最终得到指标骨架图,如下图所示。

模型指标骨架

模型指标骨架图

骨架填充与BI展示

将数据填充到骨架中,再按照自己想看的维度去做相应的BI展示,本文按周和月对作者进行评级,也可以按照日为维度进行监控。接下来的第三章讲解模型的应用。

三、模型的应用

这一环节主要介绍模型的应用。

俗话说得好,不能将模型落地执行的需求都是在耍流氓。

模型好么?好!怎么用?不会!那就是一种资源浪费,数据分析师的价值就是用数据推动业务。废话不多说,来看一下模型如何应用。

应用场景一 排名奖励促生产

每月对影响力进行排名,根据排名TOP100的自媒体和用户,按照排名梯度给予额外奖励,刺激用户多发文章,发好文章。

应用场景二 热度征稿奖励

除了一些自由文章外,还需要做活动引导作者发表热门文章,比如以“国五国六排放标准的汽车如何选择”为主题的文章,贴合现阶段市场行情,更容易吸引用户的眼球;

还有类似新车抢先评测奖励,在大多数人还处在购车犹豫阶段,一篇新车抢先报可以解答用户的疑难杂症。

文章写出来,我们便可通过模型对用户进行综合评价,避免标题党的情况出现,同时作者也会获得模型加分项的加分和活动的双重奖励,促使作者输出读者想要的热门文章。

应用场景三 裂变拉新

文章还能拉新?

当然能!

其实这里面就用到了互动得分,将模型里互动得分高的文章筛选出来,作为裂变的种子,通过种子用户进行传播,达到裂变拉新的效果。

应用场景四

Know your customer,知道你所运营的作者是啥属性,一般一个内容运营手底下有许多作者,根据模型判断。

如果作者属于“沉默是金”类型,出品频率虽低,但只要出品必属精品,那就引导作者提高频率或者转变热门话题。

若属于高频低质量的“口水文”,那么有必要来一波质量提升。如果是作弊用户,那就“拜拜了您内,不送!”该应用主要是针对作者属性,精细化运营。

此模型的优势之处在于综合评估作者,而且还能将作弊之人“绳之以法”,在了解你的作者和读者基础上运营,必将事半功倍。实际上,该模型的玩法还很多,我们等待更多内容运营大神脑暴,以发挥模型最大价值。

四、模型的拓展

该模型不只局限于作者评分,还可以做渠道评估、活动评估、用户质量评估、用户积分评级系统等等。把相应的指标替换,赋予相应权重,便可套用此模型。

渠道评分模型

用户评分示例

至此,整个模型流程已经介绍完毕,后续还有多种分析方法以及策略,在这里只是抛砖引玉,就不多赘述了。最后我们就把今天分析的过程捋一捋:

流程鱼骨图

  • 模型确立
  • 纳入数据库标准确立
  • 打分标准确立
  • 权重计算
  • 变量指标筛选与调试
  • 结果展示
  • 运营并制定策略

今天给大家介绍的作者评分模型就到这里,文章里埋了个伏笔,就是用户反作弊反欺诈。

互联网的作弊行为还是相当严重的,如果无法排除这些用户及其行为,会给模型、运营策略等造成很大的负面影响,错误的数据、高效的执行便是灾难。今后会和大家分享反作弊心得,敬请期待。

写在后面:希望这篇文章可以帮助广大的运营人士,也能够让用户了解平台运营方式,同时欢迎同行与爱好者一起交流学习,提出您宝贵的意见。

 

作者:姜頔。硕士毕业于日本早稻田大学,前人人贷高级数据分析师,现易车网数据分析专家。主要负责数据运营和用户增长。

本文由 @姜頔 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 对我目前的工作指导意义很大 感谢作者!

    来自北京 回复
  2. 请问你看工作机会吗?

    来自广东 回复
  3. 写的不错。 想问下模型最后算出的综合评分,最后是动态的,你是怎么测试校验是否正确的?是否是符合当前场景下的综合评分呢?

    来自北京 回复
  4. 文章里的发布得分,是指发布时间吗

    来自北京 回复
    1. 文章介绍是发布的数量,不同类型还可以不同分数

      回复
  5. 求一个联系方式啊,之前关注了你鸟哥但是不能够私聊加

    来自北京 回复
  6. 求一个联系方式啊,之前关注了你鸟哥但是不能够私聊加

    来自广东 回复
  7. 开根号大法能够在不影响函数性质的状态下,让增长速率变小,这一步是很巧妙的。

    来自上海 回复
    1. 对的,更能照顾分值低的作者,避免低分打击作者积极性~~

      来自北京 回复
  8. 可以和您申请加个微信么

    回复
    1. 没搜到哦~~~~

      来自上海 回复
  9. 谢谢,非常实用

    回复
    1. 谢谢您得肯定~.~

      回复
  10. 关注了,非常有价值

    回复
    1. 谢谢您的肯定

      回复
  11. 确实很受用,阅读完之后收益良多。如果可以,希望您可以产出一篇文章,就是说明在不同的场景下适用于怎样的推荐算法,这是我的一个请求。十分不好意思。

    来自四川 回复
    1. 好的,我会考虑加到后面的文章里,敬请期待~~

      来自北京 回复
    2. 十分感谢您了,做产品快两年了,十分期待您的“干货”!

      来自四川 回复
  12. 之前你写的几篇现金贷的文章看不到了呀?想再次拜读一下

    回复
    1. 网贷之家里可以还能搜索到

      来自北京 回复
  13. 这个开根大法真是实用,避免给作者打分过低,影响作者积极性

    回复
    1. 是的~~尽量以鼓励为主,但又能保证整体排名不变

      来自北京 回复
  14. nice。 😈 第1个收藏的是我。

    来自北京 回复
    1. 😉 😉 😉

      来自北京 回复