北大图灵班本科生带来动画CG福音,「最懂骨骼的卷积网络」,无需配对样本实现动作迁移 | SIGGRAPH

简介: 云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 我有一个动画形象,我有一套人体动作,可想要把它们组合成真正的动画,可不是 1+1 这么简单。 别看这体型迥异的三位动作整齐划一,支撑动画的骨架却差异甚大。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!


我有一个动画形象,我有一套人体动作,可想要把它们组合成真正的动画,可不是 1+1 这么简单。

1

别看这体型迥异的三位动作整齐划一,支撑动画的骨架却差异甚大。

2

这也就意味着,想给新的动画角色套上已经做好的动作,依然需要对骨骼进行重构,费时费力。

好消息是,来自北大和北京电影学院的最新研究,正在化繁为简。

根据这项研究结果,从左到右,一个动作迁移深度学习框架就能解决,并且,不需要任何配对示例。

3

也就是说,现在,同一个动作可以被更轻松地应用于不同的形象了。

这篇论文中了计算机图形学顶会SIGGRAPH,代码现已开源。

论文一作,分别是北京电影学院研究科学家Kfir Aberman,和北大图灵班大三本科生李沛卓。

对于这一成果,论文通讯作者陈宝权教授诙谐地表示:这是最懂骨骼的卷积网络。

4

而且据说,论文和代码发布之后,就有相关工业界公司来跟研究团队接洽了。

所以这究竟是怎样一个“骨骼惊奇”的神经网络?

最懂骨骼的卷积网络

论文的主要技术贡献,是提出了全新的骨骼卷积和骨骼池化算子。

这些算子都是骨骼感知的,也就是说,它们能显式地考虑骨骼的层次结构和关节的邻近关系。

据作者李沛卓介绍,由于骨骼不具有和图片(image)一样规整的结构,但又拥有相对于一般的图(graph)更特殊的结构,新算子的设计亦是整个研究过程中最棘手的环节。

5

研究人员使用静态骨骼位置+动态关节旋转来表示骨骼上的动作,并把不同骨骼之间的动作迁移视作无配对的域转移任务,将动态静态部分分别处理,构建了用于同胚骨骼之间无需配对示例的动作迁移深度学习框架。

框架结构类似于GAN,包含两对自动编码器构成的生成器,在共同的隐空间中实现不同骨骼之间的动作迁移。还引入了判别器,以提高生成结果的质量。

6

在这其中,研究人员利用骨骼卷积算子来充分利用骨骼的拓扑结构。

具体而言,在对一个关节及其对应的单个骨骼做卷积时,将其所有距离为 d 的邻接骨骼对应的通道提取出来。同时将静态部分和动态部分的通道进行拼接,进行时间轴上的1维卷积。

11

骨骼池化,则是将不同拓扑不同的同胚骨骼合并到一个公共基本骨骼的过程。

7

研究人员介绍,这是不同骨骼的自动编码器能达到统一隐空间的基石。

效果更“服帖”

那么,“骨骼如此惊奇”的神经网络,效果如何?

接下来,我们就一起看下与其它方法比较的结果。

这个运动处理框架,是在Pytorch中实现,实验是在配备了NVIDIA GeForce GTX Titan Xp GPU(12 GB)和Intel Core i7-695X/3.0GHz CPU(16 GB RAM)的PC上进行的。

在做测试时,编码器的输入是源动作,而解码器的输入,是编码器输出的隐变量和目标骨骼信息。

而后,根据目标骨骼的拓扑结构选择相应的解码器,得到迁移后的动作。

8

主要做比较的方法包括:CycleGAN和NKN。

而做比较实验的情况也分为两种:

只使用一个自动编码器,但使用不同的骨骼信息,进行同拓扑骨骼之间的动作迁移。

使用完整的两个自动编码器,实现不同拓扑结构之间的动作迁移。

首先,来看下第一个情况下的比较:同一拓扑结构的源骨骼、目标骨骼。

9


下图从左至右,依次表示输入、CycleGAN、NKN和研究人员的方法。

10

不难看出,根据输入的这段鬼步舞,研究人员方法的“贴合度”更高。

另外,是第二种难度更高的情况:不同拓扑结构的源骨骼、目标骨骼。

11

同样的,从左至右依次为:输入、CycleGAN、NKN和研究人员的方法。

12

在这种情况下,在小人儿“踉跄”和“打斗”动作中,该方法也完胜CycleGAN和NKN。

看完定性比较,再来看下定量比较。

13


不难看出,在两种情况下,都达到了最优。

北大大三本科生一作

这篇SIGGRAPH论文,有两位共同一作。

其中一位,是北大图灵班大三本科生李沛卓。

14

李沛卓毕业于重庆一中,2016年入选重庆信息学竞赛省队,2017年以高考总分687分的成绩,北大信息科学与技术学院录取。

目前,李沛卓师从陈宝权教授,研究方向是深度学习和计算机图形学,正在北京大学视觉计算与学习实验室和北京电影学院未来影像高精尖创新中心(AICFVE)实习。

另一位,是北京电影学院AICFVE的研究科学家Kfir Aberman。

他博士毕业于以色列特拉维夫大学,现在从事深度学习和计算机图形学研究。在今年的SIGGRAPH 2020上,他有两篇一作论文入选。

15

另外,据论文通讯作者陈宝权教授透露,今年的SIGGRAPH上,“亮相”的北大本科生还不止李同学一位:

李沛卓(图灵班17级)、翁伊嘉(图灵班17级)、倪星宇(图灵班16级)、蒋鸿达(博士19级)四位同学与国内外学者合作……相关成果将发表在7月份的 SIGGRAPH 会议。

因为疫情,今年的 SIGGRAPH 会议改为在线,第一次“出道”的四位同学遗憾不能现场享受传统的视觉盛宴。基于 SIGGRAPH 的创意基因,这次虚拟会议更值得期待。

而作为一名本科生,拿到顶会论文是相当不容易的事情,在我们专访李沛卓时,他表示:

作为一个大三学生能收获一篇SIGGRAPH是很幸运的。

一方面有我自己努力的成果,但更重要的是我们团队中教授以及学长的帮助指引和付出。

我对图形学本来就特别感兴趣,能收获这篇论文更加鼓励了我继续这方面的研究。

后生可畏,后生可畏啊。

最后,也祝愿几位同学,在科研的道路上再创佳绩~

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-05-27
本文作者:鱼羊 金磊
本文来自:“量子位公众号”,了解相关信息可以关注“公众号QbitAI”

相关文章
|
6月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
7月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
417 10
|
7月前
|
机器学习/深度学习 人工智能 算法
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。
630 11
|
7月前
|
机器学习/深度学习 传感器 数据采集
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
【故障识别】基于CNN-SVM卷积神经网络结合支持向量机的数据分类预测研究(Matlab代码实现)
459 0
|
9月前
|
机器学习/深度学习 人工智能 PyTorch
零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南
卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。
498 7
|
10月前
|
机器学习/深度学习 数据采集 监控
基于CNN卷积神经网络和GEI步态能量提取的步态识别算法matlab仿真,对比不同角度下的步态识别性能
本项目基于CNN卷积神经网络与GEI步态能量提取技术,实现高效步态识别。算法使用不同角度(0°、45°、90°)的步态数据库进行训练与测试,评估模型在多角度下的识别性能。核心流程包括步态图像采集、GEI特征提取、数据预处理及CNN模型训练与评估。通过ReLU等激活函数引入非线性,提升模型表达能力。项目代码兼容Matlab2022a/2024b,提供完整中文注释与操作视频,助力研究与应用开发。
|
10月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于WOA鲸鱼优化的TCN-GRU时间卷积神经网络时间序列预测算法matlab仿真
本内容包含时间序列预测算法的相关资料,涵盖以下几个方面:1. 算法运行效果预览(无水印);2. 运行环境为Matlab 2022a/2024b;3. 提供部分核心程序,完整版含中文注释及操作视频;4. 理论概述:结合时间卷积神经网络(TCN)与鲸鱼优化算法(WOA),优化TCN超参数以提升非线性时间序列预测性能。通过因果卷积层与残差连接构建TCN模型,并用WOA调整卷积核大小、层数等参数,实现精准预测。适用于金融、气象等领域决策支持。
|
10月前
|
机器学习/深度学习 数据采集 并行计算
基于WOA鲸鱼优化的TCN时间卷积神经网络时间序列预测算法matlab仿真
本内容介绍了一种基于TCN(Temporal Convolutional Network)与WOA(Whale Optimization Algorithm)的时间序列预测算法。TCN通过扩张卷积捕捉时间序列长距离依赖关系,结合批归一化和激活函数提取特征;WOA用于优化TCN网络参数,提高预测精度。算法流程包括数据归一化、种群初始化、适应度计算及参数更新等步骤。程序基于Matlab2022a/2024b开发,完整版含详细中文注释与操作视频,运行效果无水印展示。适用于函数优化、机器学习调参及工程设计等领域复杂任务。
|
10月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化TCN-GRU时间卷积神经网络时间序列预测算法matlab仿真
本内容涵盖基于粒子群优化(PSO)与时间卷积神经网络(TCN)的时间序列预测算法。完整程序运行效果无水印,适用于Matlab2022a版本。核心代码配有详细中文注释及操作视频。理论部分阐述了传统方法(如ARIMA)在非线性预测中的局限性,以及TCN结合PSO优化超参数的优势。模型由因果卷积层和残差连接组成,通过迭代训练与评估选择最优超参数,最终实现高精度预测,广泛应用于金融、气象等领域。
|
10月前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于PSO粒子群优化TCN-LSTM时间卷积神经网络时间序列预测算法matlab仿真
本内容展示了一种基于粒子群优化(PSO)与时间卷积神经网络(TCN)的时间序列预测方法。通过 MATLAB2022a 实现,完整程序运行无水印,核心代码附详细中文注释及操作视频。算法利用 PSO 优化 TCN 的超参数(如卷积核大小、层数等),提升非线性时间序列预测性能。TCN 结构包含因果卷积层与残差连接,结合 LSTM 构建混合模型,经多次迭代选择最优超参数,最终实现更准确可靠的预测效果,适用于金融、气象等领域。

热门文章

最新文章

下一篇
开通oss服务