谷歌AI模型ML-Jam激发音乐家创作,人机合作或成未来大势!

简介: 谷歌AI研究人员兼钢琴演奏者PabloCastro正在开发一款可深度生成AI模型,让音乐家与之合作即兴创作音乐,以发掘人类即兴音乐的特点,进而打破人类创造性的界限。

image.png

智造观点

谷歌AI研究人员兼钢琴演奏者PabloCastro正在开发一款可深度生成AI模型,让音乐家与之合作即兴创作音乐,以发掘人类即兴音乐的特点,进而打破人类创造性的界限。

谷歌AI研究人员兼钢琴演奏者Pablo Castro 表示音乐家很容易会进入舒适区。

Castro在一支爵士乐队PSCTrio中演奏钢琴,他们在渥太华、蒙特利尔以及加拿大其他地区演出。他表示,“我们已经接受了很长时间的训练,所以可以使用音乐训练来创造性地发现更多的未知区域,这很可能会带来新的音乐表现形式。

image.png

经典的音乐是音乐家主要的收入来源,但是长此以往音乐可能会变得无聊并且一尘不变。为了突破音乐创造的界限,Castro决心开发一款可深度生成AI模型,鼓励音乐家通过即兴创作来挖掘更加独特的音乐。

GoogleBrain的Magenta项目中ML-Jam通过机器学习操纵音乐,意图展现音乐即兴创作的人格特征。ML-Jam利用了Magenta的DrumsRNN和MelodyRNN,有意将自己限制在预制模型中。

2016年6月,Google Brain就发布Magenta项目,该项目旨在让电脑合成具有冲击力、艺术性、并且充满惊喜的音乐,但到目前为止,投入产出比并不理想。2016年9月,谷歌旗下的英国人工智能公司DeepMind发布了一项实验的最终结果,该公司最初进行这项实验完全是出于兴趣。

DeepMind将钢琴曲样本放入WaveNet系统中以生成诸如演讲类的音频,虽然DeepMind并未披露该系统是如何运作合成音乐的,但该系统利用初始音频所合成的一段10秒钟的爵士乐颇为前卫。IBM也成立了一个名为“WatsonBeat”的研究项目,音乐家可以通过它来改变自己的曲风,使歌曲听起来具有中东风格或者“幽灵风”。

Castro表示:“实质上,我想要做的是保持我的旋律,因为这反映了我演奏的方式,但要用模型制作的音符取代我本身的音符,达成所谓的混合即兴创作。在自己的经历中,这通常不是我自己能想到的节奏,因为这不是一种有机地适合我的节奏。但它通常会成为我感兴趣的东西。

image.png

最近,Castro在北卡罗来纳州夏洛特举行的国际计算创新大会(ICCC)上发布了ML-Jam及其开源Python代码。

据他所作的介绍,ML-Jam 的运作从一种确定性鼓槽开始。有人演奏低音提琴,并添加其他乐器,然后将凹槽发送到 DrumsRNN,以生成一个独特的模型。然后,一个控制节奏模型的音乐家用 MelodyRNN 创作的旋律即兴创作一个音乐短语。

研究人员使用 Python 的多线程使 ML-Jam 的推理在一个单独的线程中运行,允许生成模型,然后在演出期间实时播放。由于生成一个模型可能会带来不可预测的时间,所以音乐家必须在舞台上使用他们未现场听到的声音。

Castro尝试让ML-Jam和他的爵士乐三人组一起演奏,但他们之间缺乏“化学反应”。所以,他计划将AI融入他自己的音乐中。他的下一步计划是使用ML-Jam或衍生系统为现场表演提供独特内容。

他开始研究的这件事本质上就是个人秀,只有他和......即兴创作围绕的这项技术。过程中,ML-Jam 变得更加有机,让他很感兴趣的是,它迫使他以一种非常不同于平常的方式来处理作曲。

“我必须考虑它是否适用于我所使用的系统类型。它像鼓一样使用一个循环,所以我必须有一些适合循环的东西,不会太重复,也不会很无聊,但仍然很适合这个想法……,所以每当我完成它的时候,无论从中得到什么,如果我没有对我自己施加这些限制,那么 100%与我想出的任何东西都会非常不同。”

最近,音乐制作也涌现出了其他杰出AI模型包括Magenta的钢琴精灵。上个月Flaming Lips在I / O表演舞台上使用了一个名为Fruit Genie的钢琴精灵版本。

Castro与AI的合作演奏可能会融入其他新颖的音乐模型,例如,Magenta音乐变换器可以制作钢琴旋律以及OpenAI的MuseNet,都可以激发更多即兴创作。 3月份,Google创建了一个以音乐转换器驱动的工具,它可以从一个人选择的键开始,然后生成听起来巴赫风格的音乐。

image.png

Castro表示,音乐生成模型的全部意义在于探索人机合作的空间,因此这些合成音乐体现的是合作,而不是试图采用外部构建的系统并将其放入人类创作的歌曲中。

“每首歌都探索一种不同类型的机器学习模型,它们不一定都是产生音乐的模型。我们的想法是看看如何将不同的机器学习技术整合到作曲或即兴创作中,以一种产生音乐的方式,如果你没有尝试将这些机器学习技术整合进来,就不会产生这样的音乐。”他说。

Castro将他的模型与其他模型区分开来,因为这款模型必须接受人工输入才能操作。对于Castro来说,人的目的—由人的历史和人性塑造—构成艺术的定义

“对我来说,问题是’艺术与否?’真的归结为’目的从何而来?’”他说。“我认为目前还没有任何模式有任何目的。这是我把人放进去的原因。”

事实上,很多音乐家并不排斥AI的介入,反而把它们作为新的灵感。法国摇滚音乐家Mathieu Peudupi(常称作Lescop)说:“如果没用人工智能,我永远无法创作这些歌曲,它带领我进入了一个全新的境遇,这就像和乐队成员一起创作一样,虽然我会忽略乐队成员大部分的建议,但在这个世界上哪有听同伴建议的歌手?
来源:微信公众号 人工智能观察

目录
相关文章
|
2天前
|
人工智能
Raspberry Pi利用AI在电子墨水显示屏上创作图片故事书
`Thomas Valadez` 创造了一款名为 `Storybook Pi` 的项目,使用 `Raspberry Pi` 和 `AI` 来自动生成带有图片的睡前故事。故事和图像在 `Pi` 上本地生成,然后显示在低功耗的电子墨水屏上。虽然创作过程大约需要五分钟,但结果是独特的。项目基于 `Raspberry Pi 5`,建议使用至少 `32GB microSD` 卡。源代码和相关信息已在 `GitHub` 开源。
|
2天前
|
人工智能 前端开发 算法
参加完全球开发者大会之后,我一个小前端尝试使用了一些AI模型
参加完全球开发者大会之后,我一个小前端尝试使用了一些AI模型
|
4天前
|
人工智能 数据安全/隐私保护
Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会
【4月更文挑战第27天】OpenAI公司的新型AI工具Sora能根据文字提示生成超逼真视频,引发关注。尽管已有类似产品,如Runway的Gen-2和谷歌的Lumiere,Sora以其高质量生成效果领先。该技术的进步可能导致2024年全球政治格局的颠覆,同时带来虚假信息的挑战。OpenAI已组建“红队”评估风险,但虚假视频识别仍是难题。尽管有水印解决方案,其有效性尚不确定。Sora在教育、医疗和科研等领域有潜力,但也对创意产业构成威胁。
13 2
|
4天前
|
人工智能 数据库 芯片
【报告介绍】中国AI大模型产业:发展现状与未来展望
【4月更文挑战第27天】中国AI大模型产业快速发展,受益于政策支持、技术创新及市场需求,已在电商等领域广泛应用,展现巨大潜力。但面临算力瓶颈、技术局限和数据不足等挑战。未来,AI大模型将向通用化与专用化发展,开源趋势将促进小型开发者参与,高性能芯片升级也将助力产业进步。[报告下载链接](http://download.people.com.cn/jiankang/nineteen17114578641.pdf)
15 2
|
4天前
|
人工智能 算法 程序员
AI程序员与人类程序员如何进行有效的合作
AI程序员与人类程序员的协作是软件开发的关键。双方通过知识共享、任务分配、代码审查和创新合作,提升效率和质量。有效沟通、尊重彼此优势、清晰分工、持续学习以及解决冲突是合作成功的关键。这种合作不仅利用AI的自动化能力,也发挥人类的创造力,共同推动行业进步。
|
4天前
|
机器学习/深度学习 人工智能 算法
AI大模型学习理论基础
本文探讨了AI大模型学习的理论基础,包括深度学习(模拟神经元工作原理,通过多层非线性变换提取特征)、神经网络结构(如前馈、循环和卷积网络)、训练方法(监督、无监督、强化学习)、优化算法(如SGD及其变种)、正则化(L1、L2和dropout防止过拟合)以及迁移学习(利用预训练模型加速新任务学习)。这些理论基础推动了AI大模型在复杂任务中的应用和人工智能的发展。
|
6天前
|
机器学习/深度学习 人工智能 安全
模型被投毒攻击,如今有了新的安全手段,还被AI顶刊接收
【4月更文挑战第25天】研究人员提出了一种结合区块链和分布式账本技术的联邦学习系统,以增强对抗投毒攻击的安全性。该系统利用智能合约支持的点对点投票和奖励惩罚机制,提高模型聚合的鲁棒性。此创新方法首次将区块链应用于联邦学习,减少中心化服务器的风险,但同时也面临计算成本增加、延迟问题以及智能合约安全性的挑战。论文已被AI顶刊接收,为金融、医疗等领域提供更安全的机器学习解决方案。[[1](https://ieeexplore.ieee.org/document/10471193)]
16 3
|
7天前
|
人工智能 搜索推荐
杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人
【4月更文挑战第24天】杨笛一团队研发的AI大模型,以“AI伙伴”和“AI导师”框架帮助社恐人群提升社交技能。通过模拟真实场景和个性化反馈,该方法降低训练门槛,增强学习者自信。但也有挑战,如保持AI模拟的真实性,防止反馈偏见,并避免过度依赖。研究强调,AI应作为辅助工具而非替代。[论文链接](https://arxiv.org/pdf/2404.04204.pdf)
13 1
|
7天前
|
人工智能 搜索推荐 决策智能
【AI Agent系列】【阿里AgentScope框架】1. 深入源码:详细解读AgentScope中的智能体定义以及模型配置的流程
【AI Agent系列】【阿里AgentScope框架】1. 深入源码:详细解读AgentScope中的智能体定义以及模型配置的流程
44 0
|
7天前
|
存储 人工智能 数据库
【AI大模型应用开发】MemGPT原理与快速上手:这可能是目前管理大模型记忆的最专业的框架和思路
【AI大模型应用开发】MemGPT原理与快速上手:这可能是目前管理大模型记忆的最专业的框架和思路
21 0