VR电影首次实现风格迁移,这要归功于AI

简介:
本文来自AI新媒体量子位(QbitAI)

制作一部VR沉浸式电影时,AI能发挥怎样的作用?

Facebook做出了一些尝试,把基于对抗生成网络(GAN)、风格迁移等方法的图像生成和处理技术用到了电影后期中。

而且是部VR电影。

Facebook巴黎AI研究院最近和电影制作公司OKIO工作室、Saint George VFX工作室,以及导演Jérôme Blanquet合作,完成了一部新VR影片:《Alteration》。

AI研究员们和电影制作团队合作,首先要解决一个最基本的问题:清晰地给电影制作团队展示AI都能做什么。这样,电影制作团队才能决定如何在影片中使用AI、用在哪里。

他们尝试了基于GAN的自动编码器和风格迁移两种特效方法,然后选定了风格迁移。

Facebook研究团队在昨天发布的博客文章中说,GAN自动编码器了虽然在科研环境中表现良好,但是生成的特效没有达到电影制作团队的预期。

如果你对“风格迁移”这个词感到陌生,看了下面这张图,一定就明白了:

风格迁移这两年来非常火热,研究界不停生产着让风格迁移更真实、更具创造性的论文和代码,各种用风格迁移来处理图片和视频的App中也层出不穷。

把风格迁移用到VR电影中,面临着两大挑战:

一是从技术上看,VR电影是高分辨率的360度立体图像,这样的图像为风格迁移带来了存储和处理时间的限制,而且风格迁移在3D图像上效果如何,也是个未知数;

二是技术团队优化算法的依据不再是某种可量化的指标,而是导演的审美情趣。

Facebook巴黎AI研究院的技术团队从三个方面解决来应对这种挑战。

首先,他们选择了17种由Julien Drevelle作品衍生出来的目标风格,要训练一个神经网络,用来对电影中的帧进行修改。

最初,他们训练迁移神经网络所用的图像,分辨率只有128×128像素,但是当把这个神经网络应用到VR影片上,发现所处理的图像尺寸非常大。因此,Facebook团队后来用768×768的图像重新训练了这个神经网络。

训练完成后,他们通过将每个目标样式应用于单个帧来生成高分辨率测试图像,然后调整样式效果的强度以创建25个不同的高分辨率输出帧。这个过程对于导演选择何种风格非常有效,同时FAIR也能从视频专业角度来确定一个良好的风格迁移。

以下是一些示例,可以看到风格迁移带来的效果。

最后,必须将模型应用于某一场景的视频帧。在每个GPU上,这些模型大约需要100GB容量的显存,所以他们改用CPU。总共使用了550个CPU时来编码完成所有的帧。当然,还得确保双眼看到的立体效果是一致的。

在这部电影中,首次实现了对VR的风格迁移,这表明AI现在已经足够成熟,可以用来作为电影人的创作工具。

影片昨天已经在Oculus的商店上架,Oculus Rift和三星GearVR都可以看:

https://www.oculus.com/experiences/rift/1514447601900695/

如果没有VR设备,上面链接中还有正常版片花可看。

【完】

本文作者:李林 
原文发布时间:2017-07-27
相关文章
|
20天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与娱乐产业:电影制作的新工具
随着科技的发展,人工智能(AI)逐渐渗透到电影制作中,带来了前所未有的创新。本文探讨了AI在剧本创作、场景构建、特效制作、动作捕捉、音频处理、剪辑及市场调研等领域的应用,以及其对提升效率、激发创意和拓宽视野的影响,展望了AI在未来电影产业中的重要作用。
|
4月前
|
人工智能 Anolis
|
4月前
|
机器学习/深度学习 人工智能 PyTorch
面向AI Native应用的高效迁移学习策略
【8月更文第1天】随着人工智能技术的发展,越来越多的应用场景需要定制化的AI解决方案。然而,从零开始训练一个深度学习模型往往需要大量的标注数据和计算资源。迁移学习提供了一种有效的方法来解决这个问题,它利用预训练模型的知识,通过少量的数据就能达到很好的性能。本文将深入探讨面向AI Native应用的高效迁移学习策略,并通过实例展示如何针对具体场景进行模型微调。
258 6
面向AI Native应用的高效迁移学习策略
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
利用迁移学习加速AI模型训练
【7月更文第29天】迁移学习是一种强大的技术,允许我们利用已经训练好的模型在新的相关任务上进行快速学习。这种方法不仅可以显著减少训练时间和计算资源的需求,还能提高模型的准确率。本文将详细介绍如何利用迁移学习来加速AI模型的训练,并通过具体的案例研究来展示其在计算机视觉和自然语言处理领域的应用。
133 4
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AICG驱动的叙事革命:AI在电影剧本创作中的角色
【7月更文第25天】随着人工智能技术的发展,尤其是自然语言处理(NLP)的进步,AI已经开始涉足创意写作领域。在电影行业中,AI不仅能够帮助创作概念和大纲,甚至还能生成完整的剧本草稿。本文将探讨AI如何改变电影剧本创作,并通过一个简单的Python示例展示如何利用AI模型生成剧本片段。
112 3
|
5月前
|
人工智能 自然语言处理 小程序
政务VR导航:跨界融合AI人工智能与大数据分析,打造全方位智能政务服务
政务大厅引入智能导航系统,解决寻路难、指引不足及咨询台压力大的问题。VR导视与AI助手提供在线预览、VR路线指引、智能客服和小程序服务,提高办事效率,减轻咨询台工作,优化群众体验,塑造智慧政务形象。通过线上线下结合,实现政务服务的高效便民。
117 0
政务VR导航:跨界融合AI人工智能与大数据分析,打造全方位智能政务服务
|
6月前
|
存储 运维 安全
Greenplum闭源?平滑迁移到 AnalyticDB 开启Data+AI新范式
知名开源 MPP 数据库 Greenplum 由于其丰富的企业级特性和出色的数据处理能力成为很多企业构建数仓的首选。近期 GP 公开 Github 仓库无法访问仅保留只读归档代码,业界纷纷猜测 GP 即将闭源。云原生数仓 AnalyticDB PostgreSQL 版完全掌控内核代码,完全兼容GP语法,全自研计算及存储引擎较比开源GP有五倍性能提升,全自研企业级特性在实时计算、弹性扩展、安全增强、高可用等方面实现对GP的全面超越,并在数仓能力上扩展了向量检索及一站式 RAG 服务,帮助企业快速构建 AI 应用、开启 Data+AI 新范式。
59156 3
|
7月前
|
存储 人工智能 API
[译][AI OpenAI-doc] 迁移指南 Beta
我们已经改变了助手 API 在 beta 的 v1 版本和 v2 版本之间工具和文件的工作方式。今天,通过 API,两个 beta 版本仍然可以访问,但我们建议尽快迁移到我们 API 的最新版本。我们将在 2024 年底之前废弃 beta 的 v1 版本。
[译][AI OpenAI-doc] 迁移指南 Beta
|
6月前
|
机器学习/深度学习 人工智能
可控核聚变新里程碑,AI首次实现双托卡马克3D场全自动优化,登Nature子刊
【6月更文挑战第4天】AI在可控核聚变研究中实现双托卡马克装置3D磁场全自动优化,助力抑制边缘能量爆发(ELMs),提升核聚变性能90%,成果登上《自然通讯》。虽有ELMs少量出现及装置适应性问题,但这一突破为经济可行的核聚变能源发展迈出重要步伐。[论文链接](https://www.nature.com/articles/s41467-024-48415-w)
96 1
|
7月前
|
机器学习/深度学习 数据采集 人工智能
KAN核心团队震撼力作!MIT华人用AI首次发现物理学全新方程
【5月更文挑战第21天】MIT华人科研团队运用AI开发OptPDE工具,首次找到3个新可积PDE家族,增强人类在物理学方程发现中的能力。OptPDE通过优化PDE系数最大化守恒量,CQFinder自动识别守恒量,二者协同工作,重新发现KdV方程并揭示新方程的特殊性质。该研究展示AI与人类科学家合作的潜力,为复杂问题解决开辟新路径。论文链接:https://arxiv.org/abs/2405.04484
105 3