备案控制台

开发者社区人工智能文章正文

Facebook开源VoiceLoop，根据开放场景语音文字合成新语音

2017-09-06 1310

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Facebook 研究员近日开源了他们在今年七月发表的一篇论文（Voice Synthesis for in-the-Wild Speakers via a Phonological Loop）中的语音合成方法。

Facebook 开源 VoiceLoop，根据开放场景语音文字合成新语音

在论文中，他们提出了一种新的文字转语音的神经网络方法，可以将从开放场景下采样到的声音中提取的文字转化为语音。不同于其他的文字转语音系统，这种方法能够处理从公开演讲中提取出来的非约束性的样本，而且网络架构比现存的解决同样问题的架构要简单。它基于新的移位缓冲内存储器区（shifting buffer working memory），这个缓冲区也可以用于评估注意力，计算输出音频，以及自身的更新。

Facebook 开源 VoiceLoop，根据开放场景语音文字合成新语音

通过使用与上下文无关（ context-free）的查找表对输入语句进行编码，该表的每个条目包含一个字符或音素。同样，能通过一个短向量来表示说话者，这个短向量也适用于新说话者。而且在生成音频之前，优先准备好缓冲区可以使生成的语音具有可变性。

上图为实验样例中生成的注意力图，X 轴是输出时间（声学样本），Y 轴是输入（文本／音素）。

作者：佚名

来源：51CTO

文章标签：

语音技术

机器学习/深度学习

网络架构

关键词：

Facebook开源

Facebook合成

Facebook场景

Facebook开放

Facebook语音

行者武松

目录

相关文章

小小何先生

|

机器学习/深度学习算法决策智能

【重磅开源】Facebook开源 Nevergrad：一种用于无梯度优化的开源工具

【重磅开源】Facebook开源 Nevergrad：一种用于无梯度优化的开源工具

小小何先生

218 0 0

愿天堂没有BUG（公众号同名）

|

缓存数据可视化测试技术

开源多年后，Facebook这个调试工具，再登Github热门榜

让许多工程师合作开发大型应用大多会面临一个挑战，通常没有一个人知道每个模块是如何工作的，这种技能会让开发新功能、调查Bug或优化性能变得困难，为了解决这个问题，Facebook创建并开源了Flipper，一个可扩展的跨平台的调试工具，用来调试 iOS 和 Android 应用。近日又双叒登上了Github热榜。

愿天堂没有BUG（公众号同名）

152 0 0

InfoQ

|

前端开发 JavaScript 测试技术

Facebook 开源可扩展文本编辑器 Lexical

Meta（原 Facebook）近日开源可扩展文本编辑器 Lexical，源代码托管在 GitHub 上采用 MIT 许可证。

InfoQ

554 0 0

Facebook 开源可扩展文本编辑器 Lexical

-开发达人-

|

人工智能自然语言处理数据挖掘

训练语言模型何需文本？Facebook发布GSLM：无需标签，从语音直接训！

不用文本就能训练语言模型？听起来像天方夜谭，竟被Facebook 给实现了！最近他们推出了一种新的语言模型训练方式GSLM，从语音开始训练，不需要标签，不需要大规模数据，不需要ASR模型，让每个语言都能享受大规模语言模型的便利！

-开发达人-

296 0 0

训练语言模型何需文本？Facebook发布GSLM：无需标签，从语音直接训！

小博测试成长之路

|

XML jenkins Java

Facebook开源静态代码分析工具Infer介绍

Infer是Facebook公司的一个开源的静态分析工具。Infer 可以分析 Objective-C， Java 或者 C 代码，用于发现潜在的问题。其作用类似于sonar和fortify。Infer更倾向于发现代码中的空指针异常、资源泄露以及内存泄漏的问题。

小博测试成长之路

949 0 0

Facebook开源静态代码分析工具Infer介绍

-开发达人-

|

机器学习/深度学习人工智能文字识别

图神经网络版本的PyTorch来了，Facebook开源GTN框架，还可对图自动微分

近日，Facebook的AI研究院发表了一篇论文「DIFFERENTIABLE WEIGHTED FINITE-STATE TRANSDUCERS」，开源了用于图网络建模的GTN框架，操作类似于PyTorch这种传统的框架，也可以进行自动微分等操作，大大提高了对图模型建模的效率。

-开发达人-

357 0 0

图神经网络版本的PyTorch来了，Facebook开源GTN框架，还可对图自动微分

码农工程师

|

移动开发 Java 程序员

Facebook 将神奇动画引擎 Pop 开源了!

Facebook 2月发布的新闻类应用Paper，因为其灵动的用户界面和交互，成为近来最令人眼前一亮的移动产品之一。而这个产品的背后是2011年Facebook收购的Push Pop Press，创始人是分别在Apple任设计师和工程师的Mike Matas与Kimon Tsinteris。他们的合作者还有传奇人物Bret Victor。他们为美国前副总统Al Gore开发的电子书Our Choice当时就曾技惊四座。

码农工程师

353 0 0

Facebook 将神奇动画引擎 Pop 开源了!

码农工程师

|

PHP C语言开发者

Facebook 发布开源编程语言 Hack

Facebook周四发布一款名为“Hack”的全新编程语言，并声称该语言将能使代码的编写和测试更加高效快速。Facebook已在公司内部使用该语言超过一年时间，现在将以开源的形式将其正式发布。

码农工程师

442 0 0

Facebook 发布开源编程语言 Hack

码农工程师

|

存储安全算法

Conceal —— Facebook推出的android数据加密的开源APIandroid数据加密的开源API

现如今很多的智能手机，都支持把应用安装到SD卡中，这会帮用户节省很多空间，但是许多黑客也会利用这一点窃取用户的隐私。一般情况下，应用都有SD卡的读写权限，当然他也可以读取到其他应用，存储在SD卡上的数据。这意味着如果你安装了恶意的应用，他就可以轻易的获取SD卡上的所有数据。

码农工程师

396 0 0

Conceal —— Facebook推出的android数据加密的开源APIandroid数据加密的开源API

码农工程师

|

SQL 存储前端开发

Facebook 在 2013 年的开源贡献

自从 Facebook 的第一行PHP代码，第一句 MySQL 的 INSERT 语句以来，开源就已经是我们工程哲学中的一个重要的部分。

码农工程师

210 0 0

Facebook 在 2013 年的开源贡献

热门文章

最新文章

高级技术文章：使用 Kotlin 和 Unirest 构建高效的 Facebook 图像爬虫

VR、AR成为Facebook F8大会上最亮眼主角

Facebook这样看“深度学习”技术

小扎再布局VR社交，Gear VR用户很快可以登陆Facebook

Facebook高管：文字分享将枯竭 5年后或许全是视频

Facebook SDK(iOS)初学讲解

Facebook将让所有的WordPress博客支持即时文章

野村：Facebook在应用下载市场上占据主导地位

Facebook计划在旧金山设立首个办公室

云栖科技评论第21期：Facebook绿色数据中心提供空前的能源使用效率

高级技术文章：使用 Kotlin 和 Unirest 构建高效的 Facebook 图像爬虫

【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch（下）

【电商搜索】现代工业级电商搜索技术-Facebook语义搜索技术QueSearch（上）

一篇文章讲明白Facebook币Libra学习

一篇文章讲明白Facebook币Libra学习

数据猎手：使用Java和Apache HttpComponents库下载Facebook图像

【专栏】GraphQL，Facebook 开发的API查询语言，正在前端开发中崭露头角

R语言ggplot2 对Facebook用户数据可视化分析

挖掘网络宝藏：利用Scala和Fetch库下载Facebook网页内容

FaceBook推出新的翻译模型Seamless！可实现跨语言交流的无缝衔接！

相关课程

更多

达摩院智能语音交互 - 语音合成技术

达摩院智能语音交互 - 语音识别技术

达摩院智能语音交互 - 声纹识别技术

达摩院智能语音交互 - 人机对话技术浅析

个性化语音合成模型微调

语音合成技术

相关电子书

更多

Facebook iOS App技术演化十年之路

Facebook Online Schema Change原理和大规模表结构变更最佳实践

复杂声学环境下的语音交互：技术与实践

相关实验场景

更多

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

以电商场景为例搭建AI语义搜索应用

AI克隆声音，基于函数计算部署GPT-Sovits语音生成模型

奥运时刻！零代码生成奥运风格AI写真。

通义万相文本绘图与人像美化

函数计算部署AI艺术字应用，生成新春文字头像

下一篇

DataWorks售前咨询