开发者学堂课程【阿里小蜜中的开放语聊技术:图谱问答】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/44/detail/970
图谱问答
图谱问答
第三部分是图谱问答,基于 ocs 的知识问答。图谱问答和业界通用理解的有一定的区别。
只是利用了一些图谱的知识,构建问答的能力,并没有用传统的记录节点,和基于节点和节点之间的关系的问答,实现这种对话。
第二点,问答并不是为了提供非常大而全的问答能力,而是为了解决在语聊中高频出现的问题,通过这种方式把能力提供出来。
用图谱做离线的 QA 对的抽取, question answer 一个对的抽取,再用文本匹配的方式做线上的问答,所以这里的图谱问答,只是用了图谱里的知识。
先看框图,首先从整个小蜜语聊的问答历史中抽取高频问题,利用图谱知识针对这些高频问题给出相应回答,把能回答的问题构建问答对,用基于检索匹配的方式得到了在线回复能力。
除了利用问答历史抽取高频问题之外,还从问答历史中抽取高频实体,利用图谱的知识,针对高频实体构建实体子图。实体子图是把实体以及和它有关联的其他实体节点,全部保存叫做实体的实体子图。利用实体子图,在在线问答的过程中,可能会遇到几种情况,首先是无歧义的实体答案合成,就是实体并没有歧义的含义,针对这种情况就会合成一种答案。
举个例子,我们通常知道刘德华是香港明星,问题是刘德华的妻子是谁,就找到刘德华的实体子图,通过夫妻关系回答他的妻子是谁,这就叫做无歧义实体答案合成。
第二部分叫歧义实体答案合成,针对像苹果,詹姆斯这些会有歧义的名字,或者产品等实体做回答,比如有人问詹姆斯的身高是多少,会做一个反问,类似于您问的是詹姆斯,勒布朗还是说哈登,这样的反问问题,确定实体到底指的是谁。
最后一个是多实体答案合成,两个实体同一种属性的对比,比如刘德华和古天乐谁比较高,或者谁年龄比较大,类似于这样的问题会给出一个回答。