对于语音交互,我认为可以在最开始,增加一个关键字作为问题的核心并且单独解决,在末尾作为答案的相互比较。
没太懂你的意思。如果是说把核心的关键字信息等抽取出来,目前有比较成熟的做法了:slot filling 了解一下。
比如。“今天广州的天气怎样呀” 这样一句话,里面的关键信息是 时间“今天”、地点“广州”。通过CRF或者RNN等方法,都可以实现。
但是,仅有关键信息显然是不够的。比如“我要听《今天广州的天气》”(假设有这么一首歌),那就崩溃了。所以还需要有意图的识别(intent classification了解一下)
时时分享云计算技术内容,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。