分析2018年「人人都是产品经理」网站的文章数据
在八月的尾巴,深入分析2018年人人都是产品经理网站上的文章数据,你的文章上榜了吗?笔者爬取了网站1月到现在的文章数据,希望发掘数据背后潜藏的价值。
一. 汇总分析
通过阅读量排序,得到了Top10阅读量的热点文章,总的来看大家偏向于阅读技术类的文章,特别是与PRD相关的文章。一方面,PRD拥有较为全面的体系,可以让读者系统深入地去了解某个APP或者事物;另一方面,PRD撰写是许多新人难以掌握的技能,值得反复阅读与学习。
从收藏量榜单分析,与阅读量相似的是,大部分人都倾向于收藏PRD分享文章,PRD被普遍认为是产品经理有用且值得持续学习的技能。除此以外,一些原理性的知识或者职场道路的发展也被大家认为十分值得收藏的内容。
基于点赞量榜单看,PRD几乎消失了。大家更多偏向于对于更为细节的方法论进行点赞,阅读这些文章后笔者发现:相比起收藏量榜单,点赞量榜单上的文章阅读时间更短、阅读难度更低、趣味性更高……
总的来说,用户点赞的驱动力来自于阅读文章带来的愉悦感;而收藏的话,用户则基于文章的可学习性进行收藏——值得反复阅读。
二.“标题文”分析
笔者设置了这样的指标来识别标题文:
标题党可能性数值 = 阅读量 /(点赞量+收藏量)
如果这个数值越大表明了更多的人只是阅读而无收藏/点赞,这说明了文章的趣味性或者价值并没有达到读者的预期,也就是说文章为标题党的可能性越大。
这十篇文章在所有的文章里拥有最大的标题党可能性数值,较大一部分属于活动策划类或者深度技术类文章。
这一类文章较难借鉴导致了收藏量的低迷,同时由于文章阅读体验一般也没有引发较高的点赞量,最终出现高阅读量下少人点赞或者收藏的情况。还有一种可能是这些文章不适合人人都是产品经理的受众。
那么哪些文章是干货呢?
这一类的文章可操作性强、阅读起来简单易懂成为了大多数人点赞或者收藏的对象。大家可以通过搜索阅读这些文章,应该会有所得。
我们来从运营的角度分析一下网站的标题文情况:
可以看到数值集中分布于0-2000(占比87%),我们可以认为2000以下的是正常的文章,500以下是较为优秀的文章(收藏率以及点赞率较高)。这样的分布表明大部分文章拥有良好的质量,数值较大的(5000以上较大可能为标题文)文章只有63篇(占比1%)。
那么我们放大0-2000的分布情况来看:
发现文章数值以数值500为中间向两边递减,进一步说明了文章质量普遍较高,大部分文章都会获得较高的点赞率与收藏率。
总的来说,网站中的标题文数量不多,绝大多数文章都对用户产生了十分有用的影响,文章运营情况良好,编辑可以通过监控干货文来更好地设置推荐位。
三. 类别分析
人人都是产品经理网站上的文章被分为了许多的不同的类别,笔者收集到的有以下十七种:
- AI人工智能
- 业界动态
- 交互体验
- 产品经理
- 产品设计
- 产品运营
- 分析评测
- 创业学院
- 区块链
- 原型设计
- 大咖分享
- 数据分析
- 文案策划
- 新零售
- 用户研究
- 职场攻略
- 营销推广
那么大家发布的文章主要是哪一类别的呢?
发布文章最多的类别是业界动态,是一些时效性较强的东西。可以发现技术性文章集中分布于数据图的右边,较少人去分享。
这也跟网站的定位有关,网站用户更注重产品而非原理,偏好思想胜于技术。
结合“干货”榜单分析,用户对于职场攻略、新零售、原型设计和用户研究等类目都有较大的需求,作家们可以更多地收集或者撰写这几类的文章。
结合“标题党”榜单分析,用户对于AI、区块链与产品运营等文章的需求过剩,较多的文章并没有对用户产品实际有效的作用。
原型设计类别拥有最多用户收藏,相反,AI较少人收藏与点赞。
以上的数据图可以简单地理解为用户对于类别的需求,而实际上会受到文章质量与阅读数量的影响带来偏差,笔者偷懒省去了对数据进行标准化的过程。
比如,新零售类目下拥有了多篇文章上榜“干货”榜单,但是受到了同类目下其他低赞低收藏文章影响导致了总体分数不高。
来看点赞量排名,可以等同于用户从最愿意到最不愿意看到的文章类别排序。
像创业、区块链和AI人工智能这些类别的文章由于阅读难度大导致了较少人点赞,而像业界动态这样的过于泛滥的文章也会导致读者不愿意去阅读。
四. 网站总体运营情况
2018年截止到8月26日平均每周有82万人次阅读人人都是产品经理文章,第一个低点是由于春节大家都倾向于过节与放松而较少阅读。
近来的阅读低点表明网站用户有些许的流失,运营需要进一步优化,最重要的核心竞争力就是内容的质量,建议编辑可以通过分析干货指标让更多的干货文有较高的曝光率来提高阅读量,实际上笔者列出的干货文榜单上面的文章阅读量都不是十分的高,可以说是在某种程度上“被埋没了”。
由于6-7周属于春节假期,网站总体的访问量不大,可以忽略6-7周的特殊数据情况。
最后我们来分析网站总体上的文章有效性情况,每周的文章数总体来说还是处在平稳波动中,而总体上看收藏数在以非常小的幅度减少。
以文章数与收藏数的比值设置了收藏比这一曲线,总体上看这一曲线在缓慢地走低,在上两周达到了全年的低点,反映出每篇收藏量的减少。
两个维度分析:
- 是不是每周推送的文章数过多了导致用户没有时间去好好阅读每一篇文章?
- 是不是文章的质量下降导致用户更少地去收藏文章?
五. 总结
本文从浅度的汇总分析到标题党识别分析到类别分析,最后回到了分析网站文章的总体情况。一步步拆解网站数据的价值,利用数据来推动网站更好地设计与推送文章,一些拙见希望能够给大家带来一些借鉴意义。
爬取了不少人人都是产品经理网站的数据,还望谅解,本意希望能够推动网站更好地建设与发展!
如果有需要数据集或者爬虫教程的小伙伴可以留言,如果人多的话笔者会另外写一篇Python爬虫入门教程,让大家能够在简历上增添爬虫与数据分析技能。
本文由 @弓心 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自 Pexels,基于 CC0 协议
好棒的文章!楼主能分享一下您的数据集嘛?我也一直想学爬虫,应该怎么做呢?
求爬虫教程啊,大神
数据爬取需求 蛮大的求指导(>﹏<)
请问数据来源是哪啊
大数据这么火,反而数据分析的文章排名那么靠后~~~
数据分析的平均点赞量和收藏量都是不低的,存在一定的需求缺口