预告:解读全新声学模型与算法:2016 年语音识别的重大进步丨硬创公开课

简介:

在去年的锤子发布会中,罗永浩现场演示了讯飞输入法后让用户意识到当下语音识别能力的强大。当然,语音识别在安静环境、常用字词、发音标准情况下已非常成熟,但在复杂环境下如远场识别、带噪声识别等情况下仍有一定的提升空间。

2016 年语音识别领域有着不小的进展,其主要体现在模型方面的突破:

Deep CNN 模型大热,百度把 Deep CNN 应用于语音识别声学建模中,将其与基于 LSTM 和 CTC 的端对端语音识别技术相结合,大大提升了语音识别能力;微软则是把 ResNet 应用于语音识别,在产业标准 Switchboard 语音识别基准测试中,实现了词错率(WER)低至 5.9% 的新突破;科大讯飞也推出了全新的深度全序列卷积神经网络 DFCNN。

与此同时,新的深度学习开源框架层出不穷,开发者做语音识别到底是用 Kaldi 这类传统框架还是用 TensorFlow 这类新型框架呢?

针对上述几大话题,雷锋网(公众号:雷锋网)硬创公开课特邀供职于阿里巴巴最神秘的研究部门 iDST 的语音专家薛少飞博士,从声学模型和算法角度深入讲述 2016 年语音识别领域的重大突破。

嘉宾介绍

预告:解读全新声学模型与算法:2016 年语音识别的重大进步丨硬创公开课

薛少飞,阿里巴巴 iDST 语音识别专家,中国科学技术大学博士。现负责阿里声学模型研究与应用:包括语音识别声学建模和深度学习在业务场景中的应用。博士期间的研究方向为语音识别说话人自适应,提出基于 Speaker Code 的模型域自适应方法,在语音相关的会议和期刊上发表论文十余篇。

本期公开课内容将包括但不限于:

  • 语音识别领域的最新进展。

  • 详解阿里的声学模型。

  • Deep CNN 的原理,相比于之前的 LSTM、RNN、CTC 模型有哪些不同和优势。

  • 介绍不同单位提出的 Deep CNN 结构,如科大讯飞提出的深度全序列卷积神经网络 DFCNN 等。

  • ResNet 在语音识别中的应用。

  • 对比传统语音识别开源框架(Kaldi、CMU Sphinx、Julius)与深度学习开源框架(CNTK、TensorFlow)

活动详情

主题:解读全新声学模型与算法:2016 年语音识别的重大进步

嘉宾:薛少飞

时间:1 月 19 日周四晚上 20:00

形式:斗鱼直播+微信群与嘉宾问答互动

地址:硬创公开课 斗鱼直播间(房间号:788495)

本期雷锋网硬创公开课将会有【斗鱼直播+微信群问答】两个环节。嘉宾直播授课分享结束后,将会在微信群与群友问答互动。

为了打造高质量且细分的读者交流群,我们需要您提交一些基本资料作简单审核,而本次公开课读者群将优先 NLP 相关从业者和学生进入。

扫描下方海报上的二维码,进入雷锋网人工智能垂直微信公众号【AI 科技评论】后,可获得详细入群方式。

预告:解读全新声学模型与算法:2016 年语音识别的重大进步丨硬创公开课


本文作者:亚峰

本文转自雷锋网禁止二次转载,原文链接

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
1月前
|
JavaScript 前端开发 算法
MVVM模型,虚拟DOM和diff算法
1.MVVM是前端开发领域当中非常流行的开发思想。(一种架构模式)目前前端的大部分主流框架都实现了这个MVVM思想,例如Vue,React等2.虽然Vue没有完全遵循MVVM模型,但是Vue的设计也受到了它的启发。Vue框架基本上也是符合MVVM思想的 3.MVVM模型当中尝到了Model和View进行了分离,为什么要分离?
|
2月前
|
算法
【算法优选】 动态规划之斐波那契数列模型
【算法优选】 动态规划之斐波那契数列模型
|
1月前
|
传感器 算法 计算机视觉
基于肤色模型和中值滤波的手部检测算法FPGA实现,包括tb测试文件和MATLAB辅助验证
该内容是关于一个基于肤色模型和中值滤波的手部检测算法的描述,包括算法的运行效果图和所使用的软件版本(matlab2022a, vivado2019.2)。算法分为肤色分割和中值滤波两步,其中肤色模型在YCbCr色彩空间定义,中值滤波用于去除噪声。提供了一段核心程序代码,用于处理图像数据并在FPGA上实现。最终,检测结果输出到"hand.txt"文件。
|
1月前
|
机器学习/深度学习 数据采集 算法
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
解码癌症预测的密码:可解释性机器学习算法SHAP揭示XGBoost模型的预测机制
114 0
|
3月前
|
机器学习/深度学习 算法 TensorFlow
文本分类识别Python+卷积神经网络算法+TensorFlow模型训练+Django可视化界面
文本分类识别Python+卷积神经网络算法+TensorFlow模型训练+Django可视化界面
63 0
文本分类识别Python+卷积神经网络算法+TensorFlow模型训练+Django可视化界面
|
1天前
|
移动开发 算法 数据可视化
数据分享|Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例
数据分享|Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例
|
3天前
|
机器学习/深度学习 算法 搜索推荐
Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型
Python用机器学习算法进行因果推断与增量、增益模型Uplift Modeling智能营销模型
30 12
|
8天前
|
算法 Serverless
如何实现马尔可夫链蒙特卡罗MCMC模型、Metropolis算法?
如何实现马尔可夫链蒙特卡罗MCMC模型、Metropolis算法?
14 0
|
10天前
电信公司churn数据客户流失k近邻(knn)模型预测分析
电信公司churn数据客户流失k近邻(knn)模型预测分析
18 0
|
11天前
|
算法
R语言使用随机技术差分进化算法优化的Nelson-Siegel-Svensson模型
R语言使用随机技术差分进化算法优化的Nelson-Siegel-Svensson模型
20 0