备案控制台

开发者社区问答正文

[@徐雷frank][¥20]如何做到精准的语音识别？

我经常想知道技术是否会赶上科幻想象力，我最终会与一个可以与人类无缝交谈的机器人进行交互？我想知道我们如何构建世界上最准确的语音识别系统？

展开

收起

晓生寒 2018-12-12 21:12:10 2108 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

游客albmwkxzhc342
我觉得语音交互目前还有这些问题：
1. 现在还是用一套定义好的流程来处理问题，比如意图识别、槽填充等，但这不是真正意义上的“理解”。还是局限在我们定义的框架内来解决问题，取决于我们对问题定义的丰富程度，以及受限于框架。
2. 如果不是一套定义好的流程，而是比较流行的端到端的方式（end to end），更加不是可解释的“理解”。取决于我们提供的数据。
3. 需要有大量的common sense来丰富理解。比如“周董”是“周杰伦”的别名。
4. 还有知识迁移等等
2019-07-17 23:20:19

赞同展开评论
徐雷知行合一

1.阿里云大学荣誉讲师， 2.MongoDB中文社区专家

我不是语音识别领域的专家，个人观点
1、最准确的语言识别系统，如果只是单纯的单词或者汉字识别，会出现错误。
2、尤其是汉语，很多多音字，同音字太多。科大飞讯做的很好了，但是据说测试数据也有造假。
3、现在的AI人机交互，绝大部分中文的，还是基于关键字匹配，或者常见问题提前设定好规则，不确定问题在大数据中搜索关键字匹配的答案。
4、目前几大语音识别集合AI的系统，基本都有大量的机器学习算法，中文分词比较难。微软小冰不错，但是也会很多错误。汉语太难明确含义了。

2019-07-17 23:20:19

赞同展开评论

问答分类：

机器人语音技术智能语音交互智能语音交互

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

83678

47

0

请问下我访问接口不通什么原因 Provisional headers are shown

3719

1

0

sql server的用户名和密码怎么查啊？

37508

21

0

重启Docker后报错：Error response from daemon

2298

0

0

this xml file does not appear to have any style in

51864

10

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60931

32

0

OSS的endpoint如何查看

37489

6

0

域名在阿里买的，服务器在百度买的，域名备案在百度云也通过备案了，现在怎么将阿里云的域名解析到百度

3654

1

0

LoRa的网络覆盖能力范围是怎么样的？

3162

1

0

阿里云服务器如何重置系统？

24722

4

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

通义灵码，文件编辑返回403错误

相关文章

企业如何选择合适的智能客服系统？（2025年12月更新）

通义万相2.6，模型使用指南

AI数字人企业全域技术新排行

国内智能客服系统有哪些值得推荐（2025年12月更新）

具身智能：零基础入门睿尔曼机械臂（五）—— 手眼标定核心原理与数学求解

还有其他疑问?