阿里巴巴跨物理界招人,世界级音频专家冯津伟入职人工智能团队iDST

简介: 11月30日阿里巴巴正式宣布,前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST,担任智能语音交互团队研究员,将负责语音交互设备端的声学设计和信号处理研究工作。

813fa6116e81c92d46f8a27948b309dfb2cfe836

阿里巴巴iDST智能语音交互团队研究员 冯津伟

11月30日阿里巴巴正式宣布,前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST,担任智能语音交互团队研究员,将负责语音交互设备端的声学设计和信号处理研究工作。

这是继今年6月任小枫入职后,iDST迎来的又一位大牛级人物。

冯津伟曾就读国内顶级声学研究机构南京大声学研究所,师从音频声学泰斗沙家正先生,并与导师一起研制出了全球第一台扬声器纸盆共振频率的自动测试系统,极大地帮助了国内的电声行业提高生产效率。冯津伟博士毕业于在主动降噪领域著名的弗吉尼亚理工大学VAL实验室。

Polycom是语音和视频协作解决方案领域的全球领导者,占全球视频会议市场份额第一。冯津伟曾在Polycom工作17年,拥有十余项美国专利,大部分已产品化,是名声在外的世界级音频专家。他曾主持开发基于麦克风阵列的视频跟踪系统,即在多人视频会议时,摄像头能基于方位和距离,精准定位发言人,产品创新性引业内效仿。

阿里巴巴iDST语音团队负责人鄢志杰表示:“冯博士的入职,是物理学和互联网间的‘跨界’。阿里严肃看待智能语音交互技术全链路,逐步组建世界级专家团队。从源头和信号采集开始,在端上做突破性的智能语音交互体验。”

此前,iDST语音团队的技术成果已通过阿里云人工智能ET等对外输出,在法庭庭审识别、智能客服、视频审核和实时字幕转写、声纹验证、物联网等多个场景成功应用。全国有近300家法院和超过6000家法庭在使用ET,每年有超过1.2亿次客服电话由ET协助人类接听。

在语音交互产品方面,阿里iDST研究的技术平台能够精准转换用户的语音为对互联网内容和服务的意图,触达手机、IoT设备、互联网汽车、电视、智能音箱等各类终端,如与斑马网络、上汽合作的的荣威互联网汽车、与海尔合作的人工智能电视等。

冯津伟入职后将依托其在声学与信号处理领域的背景,主持领导语音交互设备端的研究工作。声学是物理学分支学科之一,研究媒质中机械波的产生、传播、接收和效应。以时下最热门的智能音箱为例,如何选择麦克风的材质、摆放位置、结构,就是声学设计要解决的问题。

关于加入阿里巴巴,冯津伟认为是一次全新的机会。他表示,过去自己的专业知识基本用于会议模式,而未来阿里丰富的智能交互场景将为声学设计与信号处理的发展提供宝贵的实战经验。 

冯津伟的研究方向为“下一代人机自然交互技术”,该领域已经得到阿里巴巴重点投入,此前成立的“达摩院”就包含这一研究领域。

阿里巴巴iDST透露,冯津伟已参与一秘密项目开发,项目在全球没有先例。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
7月前
|
人工智能 分布式计算 算法框架/工具
揭开阿里巴巴PAI的神秘面纱:引领人工智能计算的新篇章
揭开阿里巴巴PAI的神秘面纱:引领人工智能计算的新篇章 随着人工智能技术的飞速发展,越来越多的企业开始关注并投入到AI的研究和应用中。阿里巴巴作为全球领先的科技公司,也在AI领域做出了卓越的贡献。今天,就让我们一起来揭开阿里巴巴PAI的神秘面纱,了解这个强大的AI平台如何引领人工智能计算的新篇章。 PAI,全称阿里巴巴公共AI平台,是一个集数据准备、模型开发与训练、模型部署于一体的综合性AI平台。PAI的业务架构分为五层,从基础设施层到业务层,涵盖了AI计算的全过程。
500 2
|
4月前
|
人工智能 自然语言处理 开发工具
探索移动应用开发之旅:从新手到专家人工智能在文本生成中的应用与挑战
【8月更文挑战第27天】本文旨在为初学者提供一条清晰的路径,通过了解移动操作系统的基础知识、选择合适的开发工具、学习编程语言以及掌握用户界面设计原则,逐步成长为移动应用开发的专家。我们将一起探讨如何将创意转化为现实中的移动应用,并确保这些应用在多样化的设备上均能良好运行。
|
5月前
|
计算机视觉 人工智能
人工智能问题之人脸识别团队决定使用LangChain来构建一个智能排查助手如何解决
人工智能问题之人脸识别团队决定使用LangChain来构建一个智能排查助手如何解决
35 1
|
7月前
|
人工智能 安全 自动驾驶
AI日报:麻省理工学院专家呼吁扩大人工智能治理和监管
AI日报:麻省理工学院专家呼吁扩大人工智能治理和监管
|
7月前
|
人工智能 自然语言处理 算法
魔搭城市行 | 南京站 · 「阿里巴巴人工智能大模型&魔搭开源社区交流论坛」成功举办
2024年1月11日下午,阿里巴巴人工智能大模型及魔搭开源社区交流沙龙 · 南京站在南京软件谷云密城L栋成功举办!
|
机器学习/深度学习 人工智能 安全
如何建设一支高效的人工智能团队
如何建设一支高效的人工智能团队
912 0
如何建设一支高效的人工智能团队
|
机器学习/深度学习 人工智能 自动驾驶
上海人工智能实验室自动驾驶团队原作解读OpenLane:大规模真实场景3D车道线数据集
上海人工智能实验室自动驾驶团队原作解读OpenLane:大规模真实场景3D车道线数据集
260 0
|
存储 机器学习/深度学习 人工智能
厦大团队用基于人工智能的量子动力学,探索光合作用如何捕获能量
厦大团队用基于人工智能的量子动力学,探索光合作用如何捕获能量
147 0
|
机器学习/深度学习 编解码 人工智能
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
中科院团队新研究:人工智能有助于从空间分辨转录组学中识别组织亚结构
157 0
|
人工智能 大数据
《阿里巴巴人工智能驱动大数据》电子版地址
阿里巴巴人工智能驱动大数据
134 0
《阿里巴巴人工智能驱动大数据》电子版地址