网易云音乐:如何通过数据发掘音乐品鉴家,进而找到宝藏小众音乐
编辑导语:在网易云音乐平台,经常能发现一些冷门但好听的宝藏歌曲,这是网易云音乐的差异化优势。网易数据产品团队是如何通过定义音乐鉴赏人,实现对小众高品质音乐的批量挖掘和冷启动呢?一起来看一下吧。
01 长尾内容信号缺失,如何发掘其中的优质内容?
作为网易云的资深用户,我在网易云上面发现了不少冷门但是真的很好听的宝藏歌曲。宝藏小众歌曲推荐算网易云音乐的差异化优势,在其他音乐平台很少见到。
今天和大家分享冷门宝藏歌曲背后的故事,看看网易数据产品团队如何通过定义音乐鉴赏人,实现对小众高品质音乐批量挖掘和冷启动。
首先聊聊为什么大部分情况下我们听不到小众歌曲。站在推荐算法的角度看,因为长尾内容用户行为数据较为稀疏,算法误判的概率很大,误判后推荐一些人气低而且不好听的内容,是对用户体验非常大的伤害。
所以一般情况下,算法会更偏好推荐热门内容,因为数据量充足置信度高。这会让整个平台追求确定性的中低收益,但这样会导致畸形的生态和音乐口味的趋同。
长尾内容:可以理解为小众,冷门,对人群的渗透率低的内容。长尾是指在概率分布图的尾巴位置。
而着重推荐成熟歌曲的算法对新晋创作者很不友好,这样的机制会让新作品和细分圈子的小众作品得不到流量的青睐,没有露脸的机会,自然无法出头。而站在平台侧的角度,如果新内容无法很好冷启动,流量总是集中在头部热度高的歌曲,对于长期健康内容生态是很不利。例如快手就因为几个直播家族流量过于集中,平台议价权被挤压,以及头部暴雷对生态打击严重。
为了保持高质量的音乐生态,给宝藏小众歌曲更多机会,网易云团队一开始的方法是人工捞取小众歌曲听,根据好听程度打分,把得分高的小众歌曲交给算法去推荐。但是人工成本高,效果挺差,因为打分人很主观,他们的音乐喜好并不能代表听歌用户,体现在数据指标上是人工筛选的歌曲冷启动成功率(播放等级跃迁成功率)有3%。
所以网易团队开始用数据产品的方式来解决这个问题,问题的成功指标是:
- 短期:小众高质量歌曲的冷启动成功率
- 长期:音乐流量分布健康,不过分集中于头部
02 先(用数据)找伯乐,再找千里马
小众歌曲的投票权,不应该集中在审核人员,而是应该下放到广大听歌的人民群众手中。用良好品味和代表性的听众的投票行为,来作为高质量音乐的信号,传递给推荐系统。找到高质量音乐鉴赏人十分关键。
音乐鉴赏人的典型画像是这样的,深夜emo的你,打开网易云,恰好听到一首小众冷门的歌,但是越听越好听,你点亮了小红心,一遍又一遍的循环播放,这点黑夜里的点赞小火星被推荐系统敏锐的捕捉到,让枯竭的流量之水开始流淌,最终让这首埋藏已有的歌得见天日。
那如何用数据发掘音乐鉴赏人呢?
音乐鉴赏人是能在高质量歌曲早期就点赞收藏这些音乐的人:
- 发现时间早:「发现歌曲时间权重分」,对用户收藏某首歌曲的时间先后进行加权处理。在某首歌曲播放到达最高等级的成长周期中,对歌曲进行较早收藏的用户得分更高,以表现该用户更好的鉴赏能力
- 升级幅度大:计算当前歌曲等级(ground truth)与收藏时等级差值、播放次数差值,找出收藏行为对应的后验热度Lift
定义音乐鉴赏人时,要注意到在国风音乐鉴赏能力强的人,不见得能鉴赏英文Rap。所以音乐鉴赏人也需要分类,按照音乐垂类划分,例如摇滚、R&B、日语、电子、民谣乡村、爵士古典等等,给各个音乐鉴赏人在这个音乐垂类进行打分。
结果:音乐鉴赏人成功地发现了许多优质小歌,这些小歌被扶持后的冷启动成功率(播放等级越迁成功率)超过40%,比例远高于之前人工打分的3%。优化了平台生态和长尾内容捞取不足的问题。
网易云团队还提供了个品鉴人发现小众歌曲的栗子:「多喝热水」这首歌自上线以来长期处于只有极少数人在听的状态,4月3日被鉴赏者发现并红心收藏,鉴赏者对该歌曲的背书被算法立即识别到,进行流量扶持分发,之后退出扶持再让其自然成长。经过2-3天的加量扶持后,歌曲有了一定的人群受众,之后逐渐快速成长,因各项指标一直良好,被算法再次加量扶持,最终冲上了站内排行榜。
网易云是通过研究小众歌曲的走红,找到了音乐鉴赏家,实现对更多小众歌曲的高效发掘。通过数据实现内容找人,人找内容,是数据产品的常见核心实践。
Web3.0的数据公司Nansen旗下的数据产品Nansen.ai也是如此,通过对交易记录的分析,给部分钱包地址打上了“smart money”的标签。这些地址在过去的交易中低买高卖,收益颇丰,地址背后往往是懂行且信息多的Crypto fund,smart LP等“聪明”的机构和个人投资者。
用户在寻找和研究区块链项目时,可以看这些smart money买了哪些,买了多少,什么时候入场,跟着聪明的人走,比自己摸着石头过河要好一点。
03 延伸思考
网易云的音乐品鉴人可以考虑在C端产品上公开,变成鼓励用户的荣耀机制(例如 “古典音乐专业品鉴人”认证)。也能放到网易云的年度报告里面。告诉用户这一年帮助多少小众歌曲被更多人发现,是一件很有价值的事情。
公开后,也要防止品鉴人的认证信息对用户行为造成扭曲。上面举的nansen的例子中,nansen.ai公布了smart money后,会有项目方向smart money地址直接发币,营造出站台的假象,这些都造成了一定程度的信息扰乱。需要进行规则打压和治理。
本文由 @元小浩Yohann 原创发布于人人都是产品经理,未经许可,禁止转载
题图来自 Unsplash,基于 CC0 协议
网易云确实是小众音乐爱好者的天堂哈哈哈哈哈哈
不得不说,网易云这个APP有时候真的是让人爱不释手,还有每次节日的H5疯狂刷爆朋友圈。
不得不说网易云的大数据还是很不错的,尤其是使用体验让用户觉得很棒
以前用网易云是里面的氛围好点,现在离不开是因为用户推送每次都让人很惊喜
网易云的用户推荐我太喜欢了,有很多以前听过的歌想不起名字也可以推送过来
以前是用酷狗,刚开始用网易云是冲着它的评论来的,现在好喜欢网易云,给我推的歌都是我喜欢的
我觉得网易云根据用户风格推的歌单就很不错啊,推给我的歌单风格都是我喜欢的
很多自己喜欢的宝藏歌曲根本不想它走红,有些歌一旦走红以后就会产生听觉疲劳
很有意思的分析!感谢作者分享!
网易云虽然大热歌的版权不多,不过在小众音乐这块储备量还是蛮大的。
看了文章后了解了很多,原来推送给用户的宝藏小众音乐背后也立足于数据。