AI技术在音乐类产品中的应用场景：你听的歌是AI写的？

搜索

APP

起点课堂会员权益

职业体系课特权

线下行业大会特权

个人IP打造特权

30+门专项技能课

1300+专题课程

12场职场软技能直播

12场求职辅导直播

12场专业技能直播

会员专属社群

荣耀标识

开通会员

发布

AI技术在音乐类产品中的应用场景：你听的歌是AI写的？

HIFIVE嗨翻屋

2020-11-13

1 评论 5311 浏览 13 收藏

产品经理在不同的职业阶段，需要侧重不同的方面，从基础技能、业务深度、专业领域到战略规划和管理能力。

编辑导读：你有没有想过，也许有一天，我们听的音乐都是AI作曲作词演唱的。随着AI人工智能的发展，它在各行各样的应用也越来越深度。在未来，AI在音乐类的产品会有怎样的应用场景呢？本文将从四个方面展开分析，希望对你有帮助。

自动标注、平滑过渡、音乐鉴权、AI创作，当AI技术应用于音乐行业为人类的精神文化与娱乐生活带来便利和更多选择时，也是一件让人激动不已的事情。

随着深度学习算法的出现、大数据和5G技术的成熟，AI人工智能已逐渐融入我们的生产生活中，在教育、医疗、政务办公、城市管理等多个方面发挥作用。

随着AI技术在音乐行业研究及应用的深入，音乐人工智能已经不新鲜，很多新的应用和产品已经惊艳亮相。

基于对于音乐技术及产品的了解，简单梳理一下目前AI技术在音乐类产品的各类应用场景。

一、自动标注

当平台曲库量达到⼀定量级时，如果再依赖传统的⼈为打标签模式就会花费⼤量成本且受到主观影响较⼤。⾳频⾃动标注相关技术就受到⼴泛关注，⾃动标注的作⽤不仅仅只是能替代⼈⼯标注以达到节省成本，同时可以客观评价⾳乐内容，因此还可以拓展到流媒体播放的⾳乐推荐⽅⾯。

例如：Spodify、KKBOX都有利⽤深度学习做推荐，其中KKBOX采⽤⾳频⽂件、歌词以及⽤户相关标注和评论等数据作为输⼊从曲⻛、场景及情绪等多个维度来判断⾳乐是否满⾜推荐的条件。⼀般的⾃动标注功能也和KKBOX的推荐维度类似，从曲⻛、应⽤场景、器乐和情绪等维度来进⾏标注。

（示例：笔者所在公司旗下平台，关于音乐标注的标签）

对于⾃动标注，笔者也在⽹上听到过一些不太专业的吐槽，比如之前有看到说音频自动标注可能会出现将一首歌曲的情绪同时标注为“欢乐”和“悲伤”两种情绪。

在解释这⼀原因之前，可以简单普及⼀下机器学习中分类器、单标签多分类任务和多标签多分类任务。

简单来说，分类器就是利⽤已知的输⼊和输出数据来训练，然后该分类器就会对未知的输⼊数据进⾏分类或输出⼀个值。对于⼀个分类器模型，它预测的结果是2个或⼤于2个以上的（结果只有1个代表结果确定就不需要分类模型了）。如果可能的结果数为2称之为⼆分类任务⼤于2就是多分类任务；对于情绪可能有：⾼亢、欢快、安静、悲伤等多个结果，因此情绪分类是⼀个多分类任务。

如果认为情绪模型是⼀个单标签多分类任务，那么绝对是不可能出现”欢乐“和”悲伤”同时出现的情况。如果同时出现“欢乐”和“悲伤”，则只能存在于多标签多分类任务。

⽽“欢乐”和“悲伤”同时出现就⼀定是错误的吗？也不⼀定！

基于深度学习的⾳乐处理⽅式⼀般是分段处理，也就是将⼀⾸⾳乐划分为多个⽚段然后对每⼀个⽚段进⾏预测判断它可能的标签。如果⼀⾸歌曲情绪存在波动，比如一首歌曲的情绪从开始的“欢乐”转向了“悲伤”，那么这种情况也是完全可能出现，现实⽣活中很多歌曲的确是存在多个情绪甚⾄互斥的标签存在的情况。

二、平滑过渡

平滑过渡功能是近⼏年新出现的“炫酷”功能。

简单理解，就是当⼀⾸歌曲快要播放完毕时下⼀⾸歌曲可能⽆缝接⼊，这种歌曲间的平滑过渡，不会让听众觉得非常突兀。

这种功能的实现，也有依赖于基于深度学习的技术。

⼤致原理是将歌曲的末尾⽚段和可能平滑过渡的其他歌曲的头部⽚段作为训练样本。训练出来的模型可以预测当前输⼊⽚段可以过渡的下⼀个⽚段，然后当播放器播放⾄歌曲尾部⽚段的时候利⽤该模型得到可平滑过渡的下⼀⾸歌曲。

三、音乐鉴权

互联网上的音乐侵权一直存在，但音乐版权方要在互联网上维护自己的权益，往往比较困难。

因为互联网具有海量的内容，而且内容形式具有复合性，比如音乐内容仅仅作为视频的背景音乐，靠人工去发现和识别，难度太大。

在这方面，AI技术的运用，已经能够实现实时监控视频、直播或⼴播节⽬中是否有存在歌曲的侵权情况。

其中的原理是，将版权⽅的曲库中歌曲提取出关键特征保存在集群数据库，然后提取待检测的⾳频特征，并通过⼤数据技术进⾏快速检索数据库中是否存在相似数据。

目前，拥有类似技术的公司，除了笔者所在公司外，ACRCloud也较具有代表性。

四、AI创作

当AI进入到音乐创作层面，在互联网行业也已有不少AI音乐创作工具，Amper Music、AIVA、Jukedeck、Ecrett Music、Melodrive、等ORB Composer等。

公司层面，索尼、谷歌、百度以及人工智能非营利组织OpenAI等均在AI作曲领域有所尝试。

2016年，索尼公司使用一种名为“流机器”(Flow Machines)的软件，创作了一首披头士(Beatles)风格的旋律，然后作曲家伯努瓦卡雷(Benoit Carre)将其制作成一首完整的流行歌曲《Daddy ‘s Car》(爸爸的车)。

2018年，微软宣布第四代小冰加入到虚拟歌手市场竞争当中，并“演唱”了一首《隐形的翅膀》。

AIVA科技开发的AI作曲家“Aiva”创作摇滚乐曲《On the Edge》并与歌手Taryn Southern合作创作流行乐曲《Love Sick》；

在国内，笔者所在公司的相关产品在AI智能创作上，能够实现识曲（识别音乐作品中的音乐元素）、作词、作曲等功能，并已实现了商业化授权和应用。

在具体的AI智能音乐创作层面，AI作曲工具可辅助创意生成。

如英国音乐制作人Alexa Da Kid利用IBM沃森认知计算平台中的机器学习音乐生成算法创作出单曲《Not Easy》、歌手Taryn Southern与AI作曲公司Amper Music开发的工具共同创作出《Break Free》与Aiva合作创作流行乐曲《Love Sick》。这些作品都曾一度成为热播曲目。

随着越来越多AI音乐创作工具的诞生，充当音乐人的辅助，协助创作出更多优质的作品，AI作曲家的音乐创作能力也在逐渐得到认可。