百度 Deep Voice 实现文本到语音的实时转换;GTX 1080 TI 发布,性能超 Titan X | AI 开发者头条

简介:

▲ 内容预览:

  • 百度实现文本到语音的实时转换

  • Facebook 发布支持 90 种语言的预训练词向量

  • 英伟达发布 GTX 1080 TI

    每日推荐阅读:

  • 高手实战演练,十大机器学习时间序列预测难题

  • 从零起步,基础机器学习模型和算法的 Python 代码实现

█ 百度 Deep Voice,实现文本到语音的实时转换

百度 Deep Voice 实现文本到语音的实时转换;GTX 1080 TI 发布,性能超 Titan X | AI 开发者头条

雷锋网消息,今日百度公开宣布了 Deep Voice,一个产品级的文本到语音转换( text-to-speech,TTS)系统。

该系统完全由深度神经网络搭建而成,最大的优势在于能够满足实时转换的要求。在以前,音频合成的速度往往非常慢,需要花费数分钟到数小时不等的时间才能转换几秒的内容,而现在,百度研究院已经能实现实时合成,在同样的 CPU 与 GPU 上,系统比起谷歌 DeepMind 在去年 9 月发布的原始音频波形深度生成模型 WaveNet,要快上400倍。

但在目前,Deep Voice 需要借助一个音素模型与音频合成组件的帮助。百度研发团队希望在未来能够实现真正意义上的端到端(end-to-end)语音合成。

详情:http://research.baidu.com/deep-voice-production-quality-text-speech-system-constructed-entirely-deep-neural-networks/

论文:https://arxiv.org/abs/1702.07825

█ Facebook 发布支持 90 种语言的预训练词向量

百度 Deep Voice 实现文本到语音的实时转换;GTX 1080 TI 发布,性能超 Titan X | AI 开发者头条

还记得 FastText 吗?就是那个 Facebook 为大型数据库文本处理发布的开源工具。今日,FastText 研究团队在 GitHub 发布了他们的最新研究成果——使用维基百科训练,并包括 90 种语言的 300 维词向量;全都使用  FastText 的默认参数进行训练。

FastText 团队表示,希望各路开发者提供使用反馈。另外,一大波新模型即将发布,请关注雷锋网(公众号:雷锋网)的后续报道。

支持语言列表与下载地址:https://github.com/facebookresearch/fastText/blob/master/pretrained-vectors.md

█ 英伟达发布 GTX 1080 TI,性能赶超 Titan X

百度 Deep Voice 实现文本到语音的实时转换;GTX 1080 TI 发布,性能超 Titan X | AI 开发者头条

今日(当地时间 28 日晚),英伟达在 GDC 大会上发布了 GTX 1080 TI。该显卡仍采用帕斯卡 16 nm 制程工艺,热设计功耗 250W,配备 11GB GDDR5X 显存。英伟达表示其性能超过 GTX 1080 约 35%。这使得 GTX 1080 TI 与 Pasal Titan X 的性能不相上下,部分非公版型号甚至可能犹有过之。

另外,GTX 1080 TI 的公版外观与 GTX 1080 一般无二。但英伟达在发布会上宣布,其公版散热得到了改进,包括去掉 DVI 接口以增大显卡出风口面积;使得在同等噪音水平下,相比 1080/1070 上的公版散热,新方案效果提升约 5%。

GTX 1080 Ti 将于下周上市,售价仅为 699 美元(约合人民币4808元),首批只有公版。美国销售的 GTX 1080 已开始降价,据雷锋网了解,多家零售商降幅达到 100 美元。

虽然 GTX 1080 TI 主打游戏市场,但对于深度学习开发者,只需花费泰坦一半多的价格就能买到相差无几的计算性能,具有非常大的诱惑力。目前国行价格尚未公布,雷锋网会继续关注。

详情:http://www.leiphone.com/news/201703/dv5c5cO4OvBe7brF.html

每日推荐阅读

高手实战演练,十大机器学习时间序列预测难题

这是我们的老熟人、澳大利亚机器学习专家 Jason Brownlee 最新整理的开发者实操练习。这是十道颇具挑战性的时间序列预测问题。对于这十道难题,经典的线性统计方法不足以进行解决,必须要用到高阶机器学习方法。

这些难题均来自 Kaggle。

如果你想要来点能挑战自己的高难度习题,提高处理时间序列数据集的能力,并演练机器学习技术——这十道题就是给你的。

地址:http://machinelearningmastery.com/challenging-machine-learning-time-series-forecasting-problems/

从零起步,基础机器学习模型和算法的 Python 代码实现

国外机器学习开发者 Erik Linder-Norén,把他创建多种机器学习模型所用的 Python 代码,上传到了 GitHub 与大家分享。一起来看看别人家的模型是什么样的。当然,这些算法真的是从零起步,非常基础,对于新手有最大的参考价值。

Erik Linder-Norén 上传的模型代码包括决策树、逻辑回归、多层感知机、随机森林、支持向量机等。

地址:https://github.com/eriklindernoren/ML-From-Scratch

相关文章:

Google Summer of Code 2017合作机构名单;英特尔 12 核 Skylake-X | AI 开发者头条 





本文作者:三川
本文转自雷锋网禁止二次转载, 原文链接
目录
相关文章
|
1月前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
40 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
1月前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
74 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
1月前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
31 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
2月前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
2月前
|
人工智能 Linux iOS开发
AI超强语音转文本SenseVoice,本地化部署教程!
【9月更文挑战第7天】以下是AI超强语音转文本工具SenseVoice的本地化部署教程:首先确保服务器或计算机满足硬件和软件要求,包括处理器性能、内存及操作系统等。接着从官网下载适合的安装包,并按操作系统进行安装。配置音频输入设备和语言模型后,启动SenseVoice并测试其语音转文本功能。最后根据实际使用情况进行优化调整,并定期更新以获取最新功能。详细步骤需参照官方文档。
511 1
|
存储 机器学习/深度学习 人工智能
下一站AI:实时服务
随着实时解决方案的增长与人工智能技术的发展,工作负载的日益提升以及非结构化数据的爆炸式增长,数据中心的发展方向正朝着加速计算、存储与网络适应性前进。
|
4天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
2024年,AI大模型在软件开发领域的应用正重塑传统流程,从自动化编码、智能协作到代码审查和测试,显著提升了开发效率和代码质量。然而,技术挑战、伦理安全及模型可解释性等问题仍需解决。未来,AI将继续推动软件开发向更高效、智能化方向发展。
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
AI在医疗领域的应用及其挑战
【10月更文挑战第34天】本文将探讨人工智能(AI)在医疗领域的应用及其面临的挑战。我们将从AI技术的基本概念入手,然后详细介绍其在医疗领域的各种应用,如疾病诊断、药物研发、患者护理等。最后,我们将讨论AI在医疗领域面临的主要挑战,包括数据隐私、算法偏见、法规合规等问题。
27 1
|
6天前
|
机器学习/深度学习 人工智能 算法
AI在医疗领域的应用与挑战
本文探讨了人工智能(AI)在医疗领域的应用,包括其在疾病诊断、治疗方案制定、患者管理等方面的优势和潜力。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题以及技术局限性等。通过对这些内容的深入分析,旨在为读者提供一个全面了解AI在医疗领域现状和未来发展的视角。
32 10
|
6天前
|
机器学习/深度学习 人工智能 监控
探索AI在医疗领域的应用与挑战
本文深入探讨了人工智能(AI)在医疗领域中的应用现状和面临的挑战。通过分析AI技术如何助力疾病诊断、治疗方案优化、患者管理等方面的创新实践,揭示了AI技术为医疗行业带来的变革潜力。同时,文章也指出了数据隐私、算法透明度、跨学科合作等关键问题,并对未来的发展趋势进行了展望。