顶级语音专家、MSR首席研究员俞栋:语音识别的四大前沿研究
9 月中旬,微软报告了在语音识别方面取得的新里程碑:新系统的识别词错率降至 6.3%;一个月后,微软又公布了在这一领域成功实现了历史性突破:他们的语音识别系统实现了和专业转录员相当甚至更低的词错率(WER),达到了 5.9%!机器之心在此期间曾对微软首席语音科学家黄学东进行了专访,探讨了这一连串突破性背后的技术和语音识别领域未来的可能性。近日,机器之心又对微软研究院首席研究员俞栋进行了一次独家专访,谈论了深度学习与语音识别相辅相成的发展以及相关领域的现状和未来。
构建智能音箱应用:语音识别和自然语言处理
随着人工智能技术的迅猛发展,智能音箱成为了人们生活中的常见智能设备。这些设备可以通过语音指令与用户进行交互,并执行各种任务,如播放音乐、查询天气、控制智能家居等。在幕后,智能音箱背后的核心技术是语音识别和自然语言处理。
构建智能语音助手应用:语音识别和语音合成的实践
智能语音助手应用正在成为现代应用程序的热门趋势。语音识别技术使应用能够理解和解释用户的语音输入,而语音合成技术则将计算机生成的语音转化为可听的声音。本文将介绍构建智能语音助手应用的实践方法,并展示如何使用开源工具和API进行语音识别和语音合成。