作者:鄢志杰(智捷),阿里巴巴达摩院语音实验室负责人
一、 语音AI的发展
当大家回顾语音技术的发展史时,可以清晰地发现,语音技术一直在突破与迭代,并逐渐走进每一个人的日常生活。
在语音技术发展初期,它只能识别孤立的字词,渐渐地它开始识别人们说出的句子。
随着移动互联网的发展,手机逐渐深入大家的生活。语音技术通过交互方式,在手机上与大家进行对话。随着Google Voice Search的出现,人们可以通过手机语音进行搜索或输入。
随着信号处理技术和深度学习技术的发展,大家可以在一定距离外,操控天猫精灵音箱等设备,获取互联网内容。
近年来,以阿里小蜜电话机器人为首的电话客服类型机器人,可以用非常自然的语音交互来跟大家对话。随着疫情开始,远程的音视频会议越来越多。达摩院推出了产品“听悟”,跟钉钉、闪记等音视频会议场景的AI进行联动。
在未来,AI仍需加速转动创新与应用的飞轮。一方面通过持续的算法创新,不断精进应用技术。另外一方面,把成功的应用技术尽快在各行各业落地,从而反哺算法技术。
达摩院ModelScope社区希望将创新跟应用紧密连接,推动AI研究与应用技术的不断发展。