预告:语音交互前沿技术分享——INTERSPEECH 2017系列

简介: iDST语音团队和云栖社区将共同打造一系列语音技术分享会,旨在为大家分享INTERSPEECH2017会议上语音技术各个方面的进展,首场将于10月25日(本周三)晚上7点半正式开始。

今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,共历时5天。据了解,本次大会共有839篇论文被大会接受,分成109个session。众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。

ad0dc75b25eaf95610c616f4d5d538380b2faa0d

那么作为语音交互领域顶级的国际会议,我们可以从INTERSPEECH 2017中看到哪些技术前沿趋势呢?为此,iDST语音团队和云栖社区将共同打造一系列语音技术分享会,旨在为大家分享INTERSPEECH2017会议上语音技术各个方面的进展,具体安排如下:

首期分享将在10月25日(本周三)晚上7点半正式开始,欢迎关注语音识别技术的同学报名参与(报名请戳这里)!

直播主题:语音识别技术之自适应技术

内容简介:语音识别技术是将语音转换成文字的技术,而说话人自适应技术的目的是降低语音识别中不同说话人之间的差异性带来的影响,这些差异性主要包括生理构造、语音环境和说话人情绪等。本次直播主要向大家介绍INTERSPEECH2017会议中的语音识别的自适应技术的一些研究成果。

观众受益:了解语音识别中的自适应技术及该技术的最新研究成果

讲师:黄智颖(云昔),阿里巴巴-iDST算法工程师


注:INTERSPEECH (Annual Conference of the International Speech Communication Association)是由国际语音通信协会ISCA(International Speech Communication Association)组织的语音研究领域的顶级会议之一,和ICASSP (International Conference on Acoustics, Speech, and Signal Processing)并称为国际语音领域最著名、影响力最大的两个学术会议。相对于ICASSP会议侧重声学、语音信号相关的学术讨论,INTERSPEECH会议的讨论范畴则包罗万象,从信号处理到语音识别、语音合成,以及各种相关的前处理、后处理方法,再到口语理解和语音交互,包含了语音技术相关的各个方面,堪称国际语音行业的一个年度盛会。

相关实践学习
一键创建和部署高分电影推荐语音技能
本场景使用天猫精灵技能应用平台提供的技能模板,在2-5分钟内,创建一个好玩的高分电影推荐技能,使用模板后无须代码开发,系统自动配置意图、实体等,新手0基础也可体验创建技能的乐趣。
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
17天前
|
人工智能 算法 数据挖掘
技术沙龙直播|3D-Speaker多模态说话人开源详解
技术沙龙直播|3D-Speaker多模态说话人开源详解
|
10月前
|
存储 人工智能 BI
倒计时1天!《AI模型时代的多模态数据存储、管理和应用》特邀主题演讲邀你共同收看!(文末送好礼)
QCon 全球软件开发大会·北京站将于 9 月 3 - 5 日正式开幕,评论区留言免费送大会3日联票(包3天午餐);另外还有定制充电宝和限量款奥运云小宝盲盒等你拿!
411 0
|
人工智能 前端开发 大数据
大数据、人工智能、VR、Docker、前端、网络,双11技术视频、讲义、文章一键收 ##您的好友演讲视频+PDF讲义已上线##
目前相关活动视频、整理文章即将出炉,所有用户还可以通过以下两种途径下载所有嘉宾的讲义!
43269 4
|
机器学习/深度学习 人工智能 算法
猿桌会 | 语音识别技术分享
来自云从科技的语音识别资深算法研究员杨学锐将为我们分享语音识别技术的相关内容
778 0
LiveVideoStackCon讲师热身分享 ( 九 ) —— 51Talk音视频技术思考及非典型挑战
LiveVideoStackCon 2018音视频技术大会是每年的多媒体技术人的盛宴,为了让参会者与大会讲师更多互动交流,我们推出了LiveVideoStackCon讲师热身分享第一季,在每周四晚19:30,邀请1名大会讲师进行线上分享技术干货,解答热点问题。
1562 0
|
编解码
LiveVideoStackCon讲师热身分享 ( 三 ) —— Facebook的工具文化与多媒体QoE
LiveVideoStackCon 2018音视频技术大会是每年的多媒体技术人的盛宴,为了让参会者与大会讲师更多互动交流,我们推出了LiveVideoStackCon讲师热身分享第一季,在每周四晚19:30,邀请1名大会讲师进行线上分享技术干货,解答热点问题。
1496 0
|
分布式计算 安全 大数据
9月5日云栖精选夜读:智能语音交互:阿里的研究和实践
云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲。本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出。
3626 0
|
机器学习/深度学习 自然语言处理 机器人
智能语音交互:阿里的研究和实践
云栖TechDay40期,iDST智能语音交互团队总监智捷带来智能语音交互的演讲。本文主要讲解了语音识别的核心组件,语音识别准确率以及影响准确率因素,还分享了iDST智能语音交互以及阿里云的对外输出。
5156 0