迪士尼研究院用深度学习打造语音动画,让VR社交更真实

简介:

基于深度学习的系统可以提供更高的准确性以及细节度。

最近,迪士尼研究院联合东安格利亚大学、加利福尼亚理工大学和卡内基梅隆大学的研究人员,发布了一篇题为“A Deep Learning Approach for Generalized Speech Animation”的论文,阐述了通过深度学习来实现程序语音动画的方法。该方法采样完人们的录音后,即可自动生成与语音相匹配的口型动画。

迪士尼研究院用深度学习打造语音动画,让VR社交更真实

据了解,这是一个借助深度学习方法进行训练的系统,它能够分析来自任何扬声器的音频,学习从语音标签输入序列到口部运动的任意非线性映射,然后系统会自动生成相应的口形以及符合语音的面部模型。

如果应用到虚拟现实中,可以让虚拟的人物形象在说话的时候保持和现实中用户相同的口型变化,让VR社交应用的VR形象更加逼真。而且对于虚拟化身语音动画来说,虽然口型追踪是比较准确的方法,但是在这种口型追踪硬件普及之前,迪士尼研究院的程序语音动画是一个行之有效的好方式。

另外,在一些VR社交应用中也有通过系统实现语音动画的方式,主要也是基于音频来制作虚拟形象的口型动画,而基于深度学习的系统可以提供更高的准确性以及细节度。


原文发布时间: 2017-08-17 11:17
本文作者: 巫盼
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。
相关文章
|
11月前
|
机器学习/深度学习 算法 安全
物理攻击「损害」深度学习系统,CV、语音领域如何防御?(3)
物理攻击「损害」深度学习系统,CV、语音领域如何防御?
112 0
|
11月前
|
机器学习/深度学习 传感器 编解码
物理攻击「损害」深度学习系统,CV、语音领域如何防御?(2)
物理攻击「损害」深度学习系统,CV、语音领域如何防御?
150 0
|
11月前
|
机器学习/深度学习 传感器 数据可视化
物理攻击「损害」深度学习系统,CV、语音领域如何防御?(1)
物理攻击「损害」深度学习系统,CV、语音领域如何防御?
|
机器学习/深度学习 文字识别 算法
深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测
深度学习基础5:交叉熵损失函数、MSE、CTC损失适用于字识别语音等序列问题、Balanced L1 Loss适用于目标检测
|
机器学习/深度学习 传感器 人工智能
物理攻击「损害」深度学习系统,CV、语音领域如何防御?
本文结合三篇最新的论文具体讨论计算机视觉领域中的物理攻击及检测方法,包括视觉领域和音频领域。
247 0
物理攻击「损害」深度学习系统,CV、语音领域如何防御?
|
vr&ar 图形学
动画如何支持VR
动画如何支持VR
104 0
|
机器学习/深度学习 存储 人工智能
Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)
Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)
Python之GUI:基于Python的GUI界面设计的一套AI课程学习(机器学习、深度学习、大数据、云计算等)推荐系统(包括语音生成、识别等前沿黑科技)
|
机器学习/深度学习 人工智能 算法
清华人工智能研究院院长张钹:深度学习的钥匙丢在黑暗角落
近日,中国科学院院士、清华大学人工智能研究院院长张钹在一次学术活动中阐述深度学习方法易受欺骗、易受攻击的根本原因。
清华人工智能研究院院长张钹:深度学习的钥匙丢在黑暗角落
|
机器学习/深度学习 算法 测试技术
邓滨:信号处理+深度学习才能实现语音交互
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/vn9PLgZvnPs1522s82g/article/details/82504828 ...
1414 0

热门文章

最新文章