谷歌新研究项目Magenta:利用人工智能创作艺术

简介:


配图-谷歌研究人员道格拉斯·埃克展示人工智能生成的图像

5月23日消息,据国外媒体PopularScience报道,谷歌将于6月1日推出新的研究项目Magenta,以探索利用人工智能来创作艺术,同时为开源人工智能平台TensorFlow的用户简化这一过程。

该团队目前有6位研究人员,未来还将邀请其他的学者帮助解决创造性机器的难题。该项目来自GoogleBrain谷歌大脑部门。

Magenta项目研究人员道格拉斯·埃克(DouglasEck)表示,该团队将会首先解决能够生成音乐的算法,然后再研发视频及其它视觉艺术的算法。

这绝不会是轻松的任务,毕竟即便最先进的人工智能系统在模仿现有艺术家和音乐家的作品风格上都遇到不少麻烦,更不用说让它们自行想出全新的创意了。埃克在音乐科技节Moogfest的一个研讨会上坦言,人工智能系统还有很长的路要走。

Magenta将会先推出一个简单的应用程序,帮助研究人员将来自MIDI音乐文件的音乐数据输入到TensorFlow,以为他们的系统带来音乐知识训练。

“有几样东西使得我想要创建Magenta,其中一样就是,看到创造性深度学习艺术出现令人惊叹的全面进步。我想要在这方面做一点启发工作。”埃克上说道。

埃克说,他对该项目的灵感来自于GoogleDeepDream技术。GoogleDeepDream是研究人员用以研究其人工智能算法如何感知物体的一种方式,能够因应要求生成相关物体。

据埃克介绍,Magenta项目将会在谷歌的开源人工智能平台TensorFlow上开源打造全部的深度学习模型。他说,他们希望,通过该开源项目,其他人将能够利用谷歌的成果,并对其进行进一步的延伸。该项目的GitHub页面目前还是空白状态(只有一个说明文件),但不久之后它将会迎来它的第一个代码。

埃克团队的成员亚当·罗伯茨(AdamRoberts)透露,Magenta团队将从6月1日开始公布更多有关它将要打造的资源的信息,在GitHub页面上增加新软件,以及定期在博客上更新项目动态。罗伯茨还展示了他在开发的一款简单的数字合成器程序,在该程序中,人工智能在听到他弹奏的音符之后,能够利用那些音符弹奏出更加完整的旋律。

埃克称,该项目的目标是形成一个可定期给听众带来令人兴奋的全新音乐的系统,让他们可以躺在沙发上时享受动听的计算机生成音乐。不过,他也坦言,至少在可预见的未来里,那种艺术创造可能还将需要一定程度的人工参与,因为开发能够完全独立创作的机器人的难度很大。

埃克还提到了潜在的Magenta应用,该应用会展示Magenta项目所创造的音乐和视觉艺术。它旨在估量人们喜欢那些艺术是因为它们很新颖特别,还是因为它们本身有内在的艺术价值。

虽然谷歌的人工智能系统短期内不大可能会替代流行歌手,但埃克预计,计算机生成的音乐不久之后将会出现在特定的场景中。例如,当支持心率监测的可穿戴设备给你的智能手机发来你感到压力很大的信号的时候,专为你创造舒适音乐的人工智能系统会给你生成一些减压舒缓的音乐。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。
目录
相关文章
|
16天前
|
机器学习/深度学习 人工智能 自然语言处理
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
MMAudio 是一个基于多模态联合训练的高质量 AI 音频合成项目,能够根据视频内容或文本描述生成同步的音频。该项目适用于影视制作、游戏开发、虚拟现实等多种场景,提升用户体验。
67 7
MMAudio:开源 AI 音频合成项目,根据视频或文本生成同步的音频
|
24天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
61 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
1月前
|
机器学习/深度学习 人工智能 人机交互
图形学领域的研究热点会给人工智能带来哪些挑战和机遇?
图形学中的一些研究热点,如 3D 模型生成与重建,需要大量的 3D 数据来训练模型,但 3D 数据的获取往往比 2D 图像数据更困难、成本更高。而且,3D 数据的多样性和复杂性也使得数据的标注和预处理工作更加繁琐,这对人工智能的数据处理能力提出了更高要求。例如,在训练一个能够生成高精度 3D 人体模型的人工智能模型时,需要大量不同姿态、不同体型的 3D 人体扫描数据,而这些数据的采集和整理是一项艰巨的任务.
110 50
|
1月前
|
人工智能 物联网 Shell
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
本文介绍了多个开源项目,涵盖了从量子计算错误纠正到视频生成和编辑的广泛应用领域。这些项目展示了AI技术在不同领域的创新和应用潜力。
180 10
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
|
29天前
|
存储 人工智能 缓存
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake
近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。
|
1月前
|
存储 人工智能 缓存
官宣开源|阿里云与清华大学共建AI大模型推理项目Mooncake
2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。
|
1月前
|
机器学习/深度学习 人工智能 机器人
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
推荐一些关于将图形学先验知识融入人工智能模型的研究论文
|
1月前
|
机器学习/深度学习 人工智能 数据可视化
人工智能在图形学领域的研究热点有哪些?
AIGC:通过生成对抗网络(GAN)、变分自编码器(VAE)及其变体等技术,能够根据用户输入的文字描述、草图等生成高质量、高分辨率的图像,在艺术创作、游戏开发、广告设计等领域应用广泛。如OpenAI的DALL-E、Stable Diffusion等模型,可生成风格各异、内容丰富的图像,为创作者提供灵感和素材.
|
1月前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
1月前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
121 6