开发者社区> 问答> 正文

[@徐雷frank][¥20]如何做到精准的语音识别?

我经常想知道技术是否会赶上科幻想象力,我最终会与一个可以与人类无缝交谈的机器人进行交互?我想知道我们如何构建世界上最准确的语音识别系统?

展开
收起
晓生寒 2018-12-12 21:12:10 1980 0
2 条回答
写回答
取消 提交回答
  • 我觉得语音交互目前还有这些问题:

    1. 现在还是用一套定义好的流程来处理问题,比如意图识别、槽填充等,但这不是真正意义上的“理解”。还是局限在我们定义的框架内来解决问题,取决于我们对问题定义的丰富程度,以及受限于框架。
    2. 如果不是一套定义好的流程,而是比较流行的端到端的方式(end to end),更加不是可解释的“理解”。取决于我们提供的数据。
    3. 需要有大量的common sense来丰富理解。比如“周董”是“周杰伦”的别名。
    4. 还有知识迁移等等
    2019-07-17 23:20:19
    赞同 展开评论 打赏
  • 1.阿里云大学讲师,主讲《微服务Spring Cloud设计与开发实战》《MongoDB高级实战》等课程 2.MongoDB中文社区专家 3.《MongoDB实战》第2版译者 5.吉林大学计算机科学学士、上海交通大学硕士

    我不是语音识别领域的专家,个人观点
    1、最准确的语言识别系统,如果只是单纯的单词或者汉字识别,会出现错误。
    2、尤其是汉语,很多多音字,同音字太多。科大飞讯做的很好了,但是据说测试数据也有造假。
    3、现在的AI人机交互,绝大部分中文的,还是基于关键字匹配,或者常见问题提前设定好规则,不确定问题在大数据中搜索关键字匹配的答案。
    4、目前几大语音识别集合AI的系统,基本都有大量的机器学习算法,中文分词比较难。微软小冰不错,但是也会很多错误。汉语太难明确含义了。

    2019-07-17 23:20:19
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
阿里云总监课第二期——Latency Controlled-BLSTM模型在语音识别中的应用 立即下载
今日头条推荐系统架构设计实践 立即下载
今日头条-推荐系统架构设计实践 立即下载