谷歌AI模型ML-Jam激发音乐家创作,人机合作或成未来大势!

简介: 谷歌AI研究人员兼钢琴演奏者PabloCastro正在开发一款可深度生成AI模型,让音乐家与之合作即兴创作音乐,以发掘人类即兴音乐的特点,进而打破人类创造性的界限。

image.png

智造观点

谷歌AI研究人员兼钢琴演奏者PabloCastro正在开发一款可深度生成AI模型,让音乐家与之合作即兴创作音乐,以发掘人类即兴音乐的特点,进而打破人类创造性的界限。

谷歌AI研究人员兼钢琴演奏者Pablo Castro 表示音乐家很容易会进入舒适区。

Castro在一支爵士乐队PSCTrio中演奏钢琴,他们在渥太华、蒙特利尔以及加拿大其他地区演出。他表示,“我们已经接受了很长时间的训练,所以可以使用音乐训练来创造性地发现更多的未知区域,这很可能会带来新的音乐表现形式。

image.png

经典的音乐是音乐家主要的收入来源,但是长此以往音乐可能会变得无聊并且一尘不变。为了突破音乐创造的界限,Castro决心开发一款可深度生成AI模型,鼓励音乐家通过即兴创作来挖掘更加独特的音乐。

GoogleBrain的Magenta项目中ML-Jam通过机器学习操纵音乐,意图展现音乐即兴创作的人格特征。ML-Jam利用了Magenta的DrumsRNN和MelodyRNN,有意将自己限制在预制模型中。

2016年6月,Google Brain就发布Magenta项目,该项目旨在让电脑合成具有冲击力、艺术性、并且充满惊喜的音乐,但到目前为止,投入产出比并不理想。2016年9月,谷歌旗下的英国人工智能公司DeepMind发布了一项实验的最终结果,该公司最初进行这项实验完全是出于兴趣。

DeepMind将钢琴曲样本放入WaveNet系统中以生成诸如演讲类的音频,虽然DeepMind并未披露该系统是如何运作合成音乐的,但该系统利用初始音频所合成的一段10秒钟的爵士乐颇为前卫。IBM也成立了一个名为“WatsonBeat”的研究项目,音乐家可以通过它来改变自己的曲风,使歌曲听起来具有中东风格或者“幽灵风”。

Castro表示:“实质上,我想要做的是保持我的旋律,因为这反映了我演奏的方式,但要用模型制作的音符取代我本身的音符,达成所谓的混合即兴创作。在自己的经历中,这通常不是我自己能想到的节奏,因为这不是一种有机地适合我的节奏。但它通常会成为我感兴趣的东西。

image.png

最近,Castro在北卡罗来纳州夏洛特举行的国际计算创新大会(ICCC)上发布了ML-Jam及其开源Python代码。

据他所作的介绍,ML-Jam 的运作从一种确定性鼓槽开始。有人演奏低音提琴,并添加其他乐器,然后将凹槽发送到 DrumsRNN,以生成一个独特的模型。然后,一个控制节奏模型的音乐家用 MelodyRNN 创作的旋律即兴创作一个音乐短语。

研究人员使用 Python 的多线程使 ML-Jam 的推理在一个单独的线程中运行,允许生成模型,然后在演出期间实时播放。由于生成一个模型可能会带来不可预测的时间,所以音乐家必须在舞台上使用他们未现场听到的声音。

Castro尝试让ML-Jam和他的爵士乐三人组一起演奏,但他们之间缺乏“化学反应”。所以,他计划将AI融入他自己的音乐中。他的下一步计划是使用ML-Jam或衍生系统为现场表演提供独特内容。

他开始研究的这件事本质上就是个人秀,只有他和......即兴创作围绕的这项技术。过程中,ML-Jam 变得更加有机,让他很感兴趣的是,它迫使他以一种非常不同于平常的方式来处理作曲。

“我必须考虑它是否适用于我所使用的系统类型。它像鼓一样使用一个循环,所以我必须有一些适合循环的东西,不会太重复,也不会很无聊,但仍然很适合这个想法……,所以每当我完成它的时候,无论从中得到什么,如果我没有对我自己施加这些限制,那么 100%与我想出的任何东西都会非常不同。”

最近,音乐制作也涌现出了其他杰出AI模型包括Magenta的钢琴精灵。上个月Flaming Lips在I / O表演舞台上使用了一个名为Fruit Genie的钢琴精灵版本。

Castro与AI的合作演奏可能会融入其他新颖的音乐模型,例如,Magenta音乐变换器可以制作钢琴旋律以及OpenAI的MuseNet,都可以激发更多即兴创作。 3月份,Google创建了一个以音乐转换器驱动的工具,它可以从一个人选择的键开始,然后生成听起来巴赫风格的音乐。

image.png

Castro表示,音乐生成模型的全部意义在于探索人机合作的空间,因此这些合成音乐体现的是合作,而不是试图采用外部构建的系统并将其放入人类创作的歌曲中。

“每首歌都探索一种不同类型的机器学习模型,它们不一定都是产生音乐的模型。我们的想法是看看如何将不同的机器学习技术整合到作曲或即兴创作中,以一种产生音乐的方式,如果你没有尝试将这些机器学习技术整合进来,就不会产生这样的音乐。”他说。

Castro将他的模型与其他模型区分开来,因为这款模型必须接受人工输入才能操作。对于Castro来说,人的目的—由人的历史和人性塑造—构成艺术的定义

“对我来说,问题是’艺术与否?’真的归结为’目的从何而来?’”他说。“我认为目前还没有任何模式有任何目的。这是我把人放进去的原因。”

事实上,很多音乐家并不排斥AI的介入,反而把它们作为新的灵感。法国摇滚音乐家Mathieu Peudupi(常称作Lescop)说:“如果没用人工智能,我永远无法创作这些歌曲,它带领我进入了一个全新的境遇,这就像和乐队成员一起创作一样,虽然我会忽略乐队成员大部分的建议,但在这个世界上哪有听同伴建议的歌手?
来源:微信公众号 人工智能观察

目录
相关文章
|
1月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
367 109
|
11天前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
433 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
23天前
|
机器学习/深度学习 数据采集 人工智能
PyTorch学习实战:AI从数学基础到模型优化全流程精解
本文系统讲解人工智能、机器学习与深度学习的层级关系,涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程,结合数学原理与代码实践,深入浅出地介绍激活函数、反向传播等核心概念,助力快速入门深度学习。
76 1
|
2月前
|
人工智能 自然语言处理 搜索推荐
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
182 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
14天前
|
人工智能 负载均衡 API
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
大家好,我是Immerse,独立开发者、AGI实践者。分享编程、AI干货、开源项目与个人思考。关注公众号“沉浸式趣谈”,获取独家内容。Vercel新推出的AI Gateway,统一多模型API,支持自动切换、负载均衡与零加价调用,让AI开发更高效稳定。一行代码切换模型,告别接口烦恼!
149 1
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
|
20天前
|
人工智能 IDE 开发工具
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
CodeGPT是一款基于AI的编程辅助插件,支持代码生成、优化、错误分析和单元测试,兼容多种大模型如Gemini 2.0和Qwen2.5 Coder。免费开放,适配PyCharm等IDE,助力开发者提升效率,新手友好,老手提效利器。(238字)
147 1
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
|
1月前
|
人工智能 监控 Kubernetes
稳定支撑大规模模型调用,携程旅游的 AI 网关实践
为了进一步提升服务水平和服务质量,携程很早就开始在人工智能大模型领域进行探索。而随着工作的深入,大模型服务的应用领域不断扩大,公司内部需要访问大模型服务的应用也越来越多,不可避免的就遇到了几个问题,我们自然就会想到使用网关来对这些服务接入进行统一管理,并增加各种切面上的流量治理功能。
157 37
|
17天前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
249 8
|
2月前
|
人工智能 自然语言处理 机器人
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型
AI Compass前沿速览:Jetson Thor英伟达AI计算、Gemini 2.5 Flash Image、Youtu腾讯智能体框架、Wan2.2-S2V多模态视频生成、SpatialGen 3D场景生成模型

热门文章

最新文章