VR电影首次实现风格迁移,这要归功于AI

简介:
本文来自AI新媒体量子位(QbitAI)

制作一部VR沉浸式电影时,AI能发挥怎样的作用?

Facebook做出了一些尝试,把基于对抗生成网络(GAN)、风格迁移等方法的图像生成和处理技术用到了电影后期中。

而且是部VR电影。

Facebook巴黎AI研究院最近和电影制作公司OKIO工作室、Saint George VFX工作室,以及导演Jérôme Blanquet合作,完成了一部新VR影片:《Alteration》。

AI研究员们和电影制作团队合作,首先要解决一个最基本的问题:清晰地给电影制作团队展示AI都能做什么。这样,电影制作团队才能决定如何在影片中使用AI、用在哪里。

他们尝试了基于GAN的自动编码器和风格迁移两种特效方法,然后选定了风格迁移。

Facebook研究团队在昨天发布的博客文章中说,GAN自动编码器了虽然在科研环境中表现良好,但是生成的特效没有达到电影制作团队的预期。

如果你对“风格迁移”这个词感到陌生,看了下面这张图,一定就明白了:

风格迁移这两年来非常火热,研究界不停生产着让风格迁移更真实、更具创造性的论文和代码,各种用风格迁移来处理图片和视频的App中也层出不穷。

把风格迁移用到VR电影中,面临着两大挑战:

一是从技术上看,VR电影是高分辨率的360度立体图像,这样的图像为风格迁移带来了存储和处理时间的限制,而且风格迁移在3D图像上效果如何,也是个未知数;

二是技术团队优化算法的依据不再是某种可量化的指标,而是导演的审美情趣。

Facebook巴黎AI研究院的技术团队从三个方面解决来应对这种挑战。

首先,他们选择了17种由Julien Drevelle作品衍生出来的目标风格,要训练一个神经网络,用来对电影中的帧进行修改。

最初,他们训练迁移神经网络所用的图像,分辨率只有128×128像素,但是当把这个神经网络应用到VR影片上,发现所处理的图像尺寸非常大。因此,Facebook团队后来用768×768的图像重新训练了这个神经网络。

训练完成后,他们通过将每个目标样式应用于单个帧来生成高分辨率测试图像,然后调整样式效果的强度以创建25个不同的高分辨率输出帧。这个过程对于导演选择何种风格非常有效,同时FAIR也能从视频专业角度来确定一个良好的风格迁移。

以下是一些示例,可以看到风格迁移带来的效果。

最后,必须将模型应用于某一场景的视频帧。在每个GPU上,这些模型大约需要100GB容量的显存,所以他们改用CPU。总共使用了550个CPU时来编码完成所有的帧。当然,还得确保双眼看到的立体效果是一致的。

在这部电影中,首次实现了对VR的风格迁移,这表明AI现在已经足够成熟,可以用来作为电影人的创作工具。

影片昨天已经在Oculus的商店上架,Oculus Rift和三星GearVR都可以看:

https://www.oculus.com/experiences/rift/1514447601900695/

如果没有VR设备,上面链接中还有正常版片花可看。

【完】

本文作者:李林 
原文发布时间:2017-07-27
相关文章
|
4月前
|
人工智能 监控 前端开发
支付宝 AI 出行助手高效研发指南:4 人团队的架构迁移与提效实战
支付宝「AI 出行助手」是一款集成公交、地铁、火车票、机票、打车等多项功能的智能出行产品。
775 21
支付宝 AI 出行助手高效研发指南:4 人团队的架构迁移与提效实战
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
迁移学习:让小数据也能驱动AI大模型
迁移学习:让小数据也能驱动AI大模型
339 99
|
3月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
267 10
|
4月前
|
数据采集 人工智能 自然语言处理
让AI读懂代码需求:模块化大模型微调助力高效代码理解与迁移
本文介绍了一种解决开源项目代码升级中“用户需求关联相应代码”难题的创新方法。面对传统Code RAG和Code Agent在召回率、准确率和稳定性上的不足,以及领域“黑话”和代码风格差异带来的挑战,作者团队提出并实践了一套以大模型微调(SFT)为核心的解决方案。
822 21
|
9月前
|
机器学习/深度学习 人工智能 算法
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频,支持自定义相机轨迹和多种动态路径,生成高质量且时间平滑的视频。
625 0
Stable Virtual Camera:2D秒变3D电影!Stability AI黑科技解锁无限运镜,自定义轨迹一键生成
|
5月前
|
人工智能 数据可视化 Java
性能提升 10 倍, DIFY 模式迁移至 Spring AI Alibaba 模式 零改造实现
将 Dify 应用迁移至 Spring AI Alibaba,可兼顾可视化开发效率与代码工程灵活性,显著提升系统性能与扩展能力,适用于复杂 AI 业务场景。
867 0
|
9月前
|
人工智能 自然语言处理 搜索推荐
创作者会被AI取代吗?AIGC为电影行业带来新变革
在AI技术飞速发展的今天,AIGC(AI生成内容)正深刻改变电影行业的内容生成、制作流程与商业模式。创作者角色从执行者向策划者转变,需与AI协作挖掘创意与情感价值。生成式人工智能认证(GAI认证)成为新时代创作者必备资质,助力其在人机共生的新生态中保持竞争力,共同推动创作领域迈向更高层次。拥抱变革,共创未来,是每个创作者在AI时代的必由之路。
创作者会被AI取代吗?AIGC为电影行业带来新变革
|
9月前
|
人工智能 编解码 运维
当ChatGPT能写情书、Sora会造电影:我们必须掌握的AI内容识别技能
随着AI技术迅猛发展,AI生成内容在文学、新闻、绘画等领域广泛应用,但其真假难辨、质量参差不齐,可能带来信息误导、知识产权侵犯及安全风险等问题。学会识别AI生成内容至关重要,包括通过逻辑漏洞排查、语言风格分析、生物特征异常检测等手段审核文本、图片和视频。人工审核在面对高隐蔽性内容时仍不可替代,需结合工具与上下文理解共同筑起防护屏障。守护真实信息、规避风险,是每个人在AI时代应尽的责任。
285 7
|
9月前
|
消息中间件 人工智能 安全
秒级灾备恢复:Kafka 2025 AI自愈集群下载及跨云Topic迁移终极教程
Apache Kafka 2025作为企业级实时数据中枢,实现五大革新:量子安全传输(CRYSTALS-Kyber抗量子加密算法)、联邦学习总线(支持TensorFlow Federated/Horizontal FL框架)、AI自愈集群(MTTR缩短至30秒内)、多模态数据处理(原生支持视频流、3D点云等)和跨云弹性扩展(AWS/GCP/Azure间自动迁移)。平台采用混合云基础设施矩阵与软件依赖拓扑设计,提供智能部署架构。安装流程涵盖抗量子安装包获取、量子密钥配置及联邦学习总线设置。

热门文章

最新文章