推荐系统随想,冷启动和评论推荐

10 评论 18487 浏览 131 收藏 9 分钟

最近,我司的O2O营销系统考虑做推荐系统,虽然不是我的功能,但是趁着放假,也了解了一下。通过文章一起来学习下。

什么是推荐系统?

随着信息技术和互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。在这个时代,无论是信息消费者还是信息生产者都遇到很大的挑战;对于消费者,从大量信息中找到自己感兴趣的信息是一件非常困难的事情;对于信息生产者,让自己的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费在和信息生产者的双赢。

这是我摘抄过来的一段话,对于推荐系统给出了比较简单易懂的解释。推荐的精髓在于,我想要的你都有,你给我的都是我想要的,其中,我就是用户,你就是信息提供方。这样完美的推荐的实现,还需要一些时日,但是终归要到来,现在想来还是挺可怕的,因为可能机器比我更了解我自己。

推荐系统的冷启动

本篇文章是写给产品经理看的,所以说,我们不讨论算法,只说方法。

冷启动在整个推荐系统中,是一个非常重要而又非常难的一件事情,推荐系统一般都需要在大量的数据基础过后才能比较准确的进行推荐,而一个新用户刚使用APP的冷启动可能直接决定着这个用户还会不会使用下去,所以冷启动是一件至关重要的事情。

冷启动在互联网行业有着很多的通用的方法和经验,可以让用户更快更优质的去冷启动。那么冷启动主要关注的两个方面是,推荐的内容是否全面和内容是否可靠有用。

总结一下方法如下:

第一、尽可能用用户给你的信息,比如app music会选择让用户主动选择一些流派或歌手,根据选择结果进行冷启动,这样会比较准确。这种方法在很多APP第一次打开时都会用到。推荐关注人或者主题,都是这种原因。

第二、用户的社交信息比较重要,比如今日头条13-14年的时候做过引导用户微博登陆,登陆后会去爬取用户在微博上的一些信息,比如发的动态、图片、文章,赞过、转发过的的内容等数据,通过这些数据进行分析,比如在微博上转发了某个女歌手的新闻,就会知道用户喜欢这个女歌手,这种数据比较真实也有延续性,也符合用户最近的思维,这种数据质量比较好。

第三、有可能会涉及一些用户隐私。某些应用会上报其他app的信息,可以了解用户安装了哪些app、app中传递了哪些信息,可以了解到用户喜欢哪些东西,是喜欢游戏、美食甚至是喜欢的内容风格,可以了解到用户的喜好,用这些数据去服务冷启动会更好。所以说手机信息这块还是很有用的,手机厂商其实已经掌握了用户的各种行为,但是有个缺点就是很多手机系统不会提供读取用户app安装信息的服务。

最后,可以提供有奖征集的方法,去收集用户的年龄和性别,或者其他的社会信息,这是一种短平快的方法,但是这种方法需要提供什么样的诱惑,需要尝试中去摸索可行性。

评论推荐

除了产品的推荐,在O2O中,用户评论也是比较重要的,用户去下线消费与否很可能会因为一条好的评论或者坏的评论而改变想法。对于评论,我们有两点需要关注。

1、怎么样去识别一个优质的评论

怎样从海量的评论中找到好的、优质的评论,我们可以从以下两个方面来尝试。

  1. 通过评论内容去直接分析。字数较多的、使用高级冷僻词汇的一些评论质量相对较好,这部分可以通过算法去识别出来。其中,需要去过滤掉有过多重复词、违禁词的评论。那通过这种方法可以去简单去提取出一些相对有用的评论。
  2. 从一个评论的用户属性去出发。一般来说,哪些用户会发表的评论比较高质量呢?
  • 一种可能是学历,我觉得学历是一个相当重要一个点。因为学历高的话你所使用的词汇可能也会比较好,包括你的思考相对说完整性较好,而不会出现像小学生那种好好好、赞赞赞等这种相对来说比较水的一些评论互动。再来经过编辑筛选就更加方便了。
  • 第二种就是我们可以通过一些历史统计,比如说我发现他之前发表过一个评论可能得到点赞数都特别多,也可以帮助我们识别出来他现在发的一些最新评论是不是也是优质做一个参考。
  • 第三种可以通过一个用户他平时在我们平台上面的一些行为来确定。比如说一个用户,如果真的很懂美食,那可能在我们这边是相对活跃的。我们可以通过一些统计历史性过于发现他活跃的一些特征。提高一定的权重。
  • 第四种,这种用户本身等级都较高,在我们的平台,等级较高的用户不管是文化程度还是收入都比较高,这类用户的评论应该更加受到重视。

2、假如识别出来之后要怎么给他们设置前置规则

确实很多评论系统会有这个问题,假如一个优质评论比较早发布的话,那他一直被置顶的几率越来越高。

1)其实如果我们在算法上面做一个衰减因子。当随着时间衰退,这个因子变得越越大的时候。在打分上面,我们把热度再乘以这个因子,那就会把这个分数拉低。这样子一些刚刚上线了一些质量比较好的评论,在短时间获得大量赞的评论,可能会超过之前的评论,从而排序会出现在更靠前。

2)另外,可以尝试在评论区里面开辟一个热门评论区。由编辑精选的一些优质的评论,去不停地滚动,去尝试推荐这些评论。比如说达到曝光量一万的时候,或者达到一定的数值,这个数值可以是点赞数,也可以是其他的关键行为。

如果他达到了我们的一个预期值。那他可以继续留在这里,再把一些不满足的评论给踢掉,换其他一些优质评论上来。这样子就可以保证有比较多的新增评论可以在评论区里面不断被曝光。而且如果他真的写得好的话,其实可以他曝光之后可以

 

作者:郭小刀刀

链接:http://www.jianshu.com/p/3feb0794e8ac

本文由 @郭小刀刀 原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自PEXELS,基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
评论
评论请登录
  1. 写的很全面,力透纸背,引人深思。

    来自广东 回复
  2. 如果评论数量级在平台搭建初期,很少的情况下,是否提供给商家(店铺)把自己店铺下面的某些评论置顶的功能呢。原因

    来自上海 回复
  3. 作为一只老是写好好好、赞赞赞的烟酒僧,我表示很羞愧 ❗

    来自浙江 回复
  4. 评论从用户属性出发,这个出发点是好,但点赞评论很高并不一定就是优质评论,可能是段子或引起共鸣的批判性语言等,情况比较复杂,也是一种思路

    回复
    1. 这也是为什么网易云音乐的评论里一堆“这二胡拉得太6了”、“我的腿抖得停不下来”、“妈妈问我为什么跪了”了。

      来自浙江 回复
  5. 太有用了,最近在做评论这块,感谢分享

    回复
  6. 为啥,因子越大,相乘之后,分数会越低?

    来自北京 回复
    1. 这个因子可以是正数,也可以是负数吧。

      来自浙江 回复
    2. 上面作者写到了,这个是一个衰减因子

      来自浙江 回复
  7. 好好好,赞赞赞(笑)

    来自浙江 回复