利用人工智能“解锁”世界音乐

简介:
本文来自AI新媒体量子位(QbitAI)

人们喜欢感受的是音乐带来的那种氛围。

整理过歌单的任何人都知道,好的歌单往往有一种贯穿始终的情感。那就是为什么Gracenote的音乐数据专家已经早早地将音乐按照心情和感情区分。

稍有不同的是,Gracenote的团队不是把数据库里面1亿首歌逐个听下来,而是教计算机去探测情感,使用机器学习和人工智能去判断一首歌的风格是梦幻还是阴郁,又或者是有着淡淡的忧愁。

Gracenote的音乐总经理Brain Hamilton在最近的一次采访中说到,“机器学习是我们的一个战略优势”。

早在10年前,Gracenote就开始在做声音的情绪分类。直到现在,更多的传统算法发展成先进的神经网络,音乐产业也正在越来越多地依靠人工智能,而Gracenote就是最好的样例。

采用这种人工智能分类音乐情感的技术的关键问题在于AI不知道人的感觉。

“我们不知道一种音乐会对每一个个体产生什么样的效用”,研究部副总裁Markus Cremer在美国娱乐界杂志巨头Variety的采访中说。

Gracenote试图将情感的评判标准转换成音乐家的创作目的,他们觉得创作者的目的才是音乐背后的一种连续的情感品质,换句话说,这家公司想教会计算机去识别音乐背后的深刻感情,而不是纠结于音乐对某个个体唤起的回忆。

教计算机去识别音乐中包含的感情的过程有点像治疗:首先要给情感命名。

Gracenote的音乐团队最开始使用的分类中包括了超过100种的气氛和情感,后来扩展到400多种。其中的一些有明确的情感分类,也有像“声色犬马”或“绝望的狂暴能量”这样过于细致的描述。新的分类也在不断的加入。这是一种迭代的过程,这些分类在迭代中不断的优化。

除了这些心情清单,Gracenote也有一些为机器学习准备的训练集,音乐专家们把4000多首歌收集分类后,编制训练集本身就是一种艺术,“我们只需要保证给的音乐的例子是人们正在听的,同时那些选出来的歌也要对某一种情感具有充分的代表性,不能模棱两可,“DiMaria说。

目前的训练集里面用Lady Gaga的《Love Game》代表“性感的摇滚”,Radiohead的《pyramid song》代表“哀愁”,Beyonce的《Me,Myself&I》作为“熟悉的,轻柔而感性的”曲风的代表。

情感种类和训练集都需要不断的更新,因为艺术家们在不断地创造新的曲风,尤其对电音和hip-hop这些更新很快的曲种来说。

系统受到训练后就会被放到数百万的歌曲堆中去听了。计算机不仅仅一条条听,还把每一首歌切成700微秒的片段,然后从任意一个切片中提取出170多种声音的品质。另外,系统有时也会调用大段的音乐片段来分析一首歌的旋律或类似的特征,然后把这些值和既有的数据作比较来归纳一首歌的情感。这样下来最后的结果就不是一种单一的心情,而是某一类心情的概括。

要把所有的歌打乱重新归类是一件很复杂的事情,Gracenote的团队必须周期性维护,保证过程不出错。

计算机要听很多东西,除了乐器,声道,一层叠加到另一层的效果,还包括一些本身不是音乐的一部分的声音,比如为车载立体声或互联网流媒体优化过后的结果。

Cremer说这个系统也会可以捕获一些意料之外的东西,它会在无监督的状态下可以自己决定去注意一些压缩失真,然后和心情匹配起来。他开玩笑说,它或许会决定”都是96kbps的速度,所以这让我感到伤心“。

Gracenote一旦做好了音乐的分类,就将数据传送给客户,并以多种不同的方式使用。

一些小的媒体服务获得这些数据的授权后应用于端对端的音乐组织和推荐系统,如iPhone上的一个远程流媒体播放软件 Plex使用该公司的音乐推荐技术,来为用户提供个性化的播放列表或“心情电台”。

这个行业最大的一些音乐服务运营商也在使用这些数据,包括Apple和Spotify,但这些大玩家们不喜欢谈论他们是怎么样把数据用到产品里面的。另外,互联网上大的的流媒体运营商一般倾向于使用自己的音乐推荐算法,但他们也会用这些数据去训练和提升自己的算法。

这些数据的应用意味着音乐迷们可以清楚地了解Gracenote在音乐归类上的工作,而其他人或许不知道这个公司的人工智能技术提升了他们的音乐体验。

不论通过哪种方式,Gracenote都要保证这些数据是在国际上传播的,尤其注重新市场的授权。


8月1日,该公司宣布要在欧洲和拉美出售其音乐产品。另外,为了防止语义信息的丢失,Gracenote还专门雇佣了国际编辑真正去听那些样本歌,来找出和本土文化最为契合的翻译方式。

这种国际眼光还有另外一种形式,就是不断地去国际上搜寻新歌来训练。因此,Cremer说他们目前的状态是”我们的数据可以处理地球上每一张最新的专辑“。

像Gracenote这样的公司要做到对全球的音乐进行分类,就不能仅仅依靠人工,还要靠人工智能和类似机器试听这样的技术。仅靠人工无法对数量庞大的歌曲分类,这样就达不到根据用户最喜欢的音乐生成性化播放列表。而教会电脑去检测则可以帮助人们获得更好更完整的音乐体验。

而使用数据和技术解锁来自世界各地的音乐,是这份工作中最激动人心的部分之一。

—— ——

本文作者:颜萌
原文发布时间:2017-08-13 
相关文章
|
机器学习/深度学习 人工智能 监控
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
CVPR 2022 Oral | 人大高瓴人工智能学院让AI学会了听音乐,还开源9288个视频数据集
161 0
|
机器学习/深度学习 传感器 人工智能
Spotify会让你爱上人工智能创作的音乐吗?
科技一方面改变着音乐的创作形式,另一方面,也取代政治逐渐成为音乐发行模式的决定因素,科技甚至能够通过推动音乐产业结构的变化影响社会主流意识形态。
161 0
|
机器学习/深度学习 人工智能
阿里云人工智能小Ai将挑战音乐情感预测
本文讲的是阿里云人工智能小Ai将挑战音乐情感预测【IT168 】科技的进步带来人类生活方式的改变,智慧医疗、智能楼宇、星际探秘等科幻大片的情节,如今已然成为现实,人类历史已经进入人工智能时代。阿尔法狗(AlphaGo)刚刚战胜韩国围棋名将李世石,成为人工智能挑战人脑极限的一大热点。
2666 0
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能在医疗诊断中的应用与前景####
本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状、面临的挑战及未来发展趋势。通过分析AI如何辅助医生进行疾病诊断,提高诊断效率和准确性,以及其在个性化医疗中的潜力,文章揭示了AI技术对医疗行业变革的推动作用。同时,也指出了数据隐私、算法偏见等伦理问题,并展望了AI与人类医生协同工作的前景。 ####
33 0
|
20天前
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在现代医疗中的革新应用
本文深入探讨了人工智能(AI)技术在医疗领域的最新进展,重点分析了AI如何通过提高诊断准确性、个性化治疗方案的制定以及优化患者管理流程来革新现代医疗。文章还讨论了AI技术面临的挑战和未来发展趋势,为读者提供了一个全面了解AI在医疗领域应用的视角。
26 0
|
11天前
|
人工智能 缓存 异构计算
云原生AI加速生成式人工智能应用的部署构建
本文探讨了云原生技术背景下,尤其是Kubernetes和容器技术的发展,对模型推理服务带来的挑战与优化策略。文中详细介绍了Knative的弹性扩展机制,包括HPA和CronHPA,以及针对传统弹性扩展“滞后”问题提出的AHPA(高级弹性预测)。此外,文章重点介绍了Fluid项目,它通过分布式缓存优化了模型加载的I/O操作,显著缩短了推理服务的冷启动时间,特别是在处理大规模并发请求时表现出色。通过实际案例,展示了Fluid在vLLM和Qwen模型推理中的应用效果,证明了其在提高模型推理效率和响应速度方面的优势。
云原生AI加速生成式人工智能应用的部署构建
|
6天前
|
数据采集 人工智能 移动开发
盘点人工智能在医疗诊断领域的应用
人工智能在医疗诊断领域的应用广泛,包括医学影像诊断、疾病预测与风险评估、病理诊断、药物研发、医疗机器人、远程医疗诊断和智能辅助诊断系统等。这些应用提高了诊断的准确性和效率,改善了患者的治疗效果和生活质量。然而,数据质量和安全性、AI系统的透明度等问题仍需关注和解决。
100 10
|
13天前
|
机器学习/深度学习 人工智能 算法
探索人工智能在医疗诊断中的应用
本文深入探讨了人工智能(AI)技术在医疗诊断领域的革新性应用,通过分析AI如何助力提高诊断准确性、效率以及个性化治疗方案的制定,揭示了AI技术为现代医学带来的巨大潜力和挑战。文章还展望了AI在未来医疗中的发展趋势,强调了跨学科合作的重要性。 ###
49 9
下一篇
DataWorks