开发者学习笔记【阿里云人工智能工程师ACA认证(2023版):自然语言理解技术的介绍与应用(二)】
课程地址:https://edu.aliyun.com/course/3112108/lesson/19280
自然语言理解技术的介绍与应用(二)
四、问答系统技术介绍与应用
1、问答系统技术介绍
问答系统是一个能够回答任意自然语言形式问题的自动化系统,目标是对于一个指定问题能够得到简短精确的答案。
问答系统从外部行为上来看,跟目前主流的资讯检索的技术有两点不同,首先它的查询形式是完整的,口语化的问句;其次回传的是高精准度的网页搜索结果,或者是明确的答案的字符串。问答系统的使用者不需要去思考用什么样的问法才能得到理想的答案,只需要用口语的话的方式,直接提问。面对这种系统,使用者不要费心地去一一检视搜索引擎的网页,这样对于资讯检索的效率和资讯的普及都会有很大的帮助。
通常来说问答系统它会有三个处理流程,第一个就是分析问题,系统会收到用户的提问,就要分析问题到底是什么;分析完问题之后,要去整理把答案理出,检索,根据分析的结果,去缩小答案存在的范围,然后提取答案,这部分要考虑如何从可能存在答案的信息里面抽取出答案来,然后反馈给用户。
2、问答系统技术的实现方法
常见的问答系统通常都是采用基于自由文本的方式实现。这一类的问答系统属于开放域问答系统,能够回答一些答案存在文档集合里面的问题。这种系统的实现的方法,如图
首先问答系统会接收到问题,然后分为三个部分。第一个是分析问题,第二部分是检索答案,第三步是生成答案,提取答案,把答案再返回给提问的用户。
先看分析问题部分,第一部分首先做一个问题分类,先要分清楚问题是哪一类的问题,对问题分类的方法主要有模式匹配方法、机器学习方法这两大类;问题分类完之后是主题提取,因为后面要进行信息检索,所以需要根据问题关键信息来对文档库进行检索,查询。
为了保证这种高相关性信息检索部分所用到的查询词应该都是包含问题的主题。通过对问题进行句法分析,获得问题的中心词,然后选中心词,修饰词作为问题的主题,然后再把问题的主题作为查询词,对文档库进行检索,主题提取做完之后,也就完成了关键词提取,然后生成查询字符串。
把查询字符串交给信息检索,这就是刚才说的检索答案部分,通过信息检索在文档库里面去查找答案。信息检索的主要目的是缩小答案的范围,提高下一步答案抽取的效率和精度。
信息检索一般分为两个步骤,一个是文档检索,检索出可能包含答案的文档;接下来是段落检索,从候选文档里面检索出可能包含答案的段落,检索完成之后,问答系统还要进行答案抽取。
一般有两个步骤,先是候选答案的生成,然后再是答案提取,得到答案之后返回,这是问答系统的实现方法。
3、问答系统技术的两个应用场景
(1)智能客服
目前很多行业主要服务模式仍然是以人工服务为主,伴随着移动互联网技术的快速发展,人工客服的弊端逐渐的凸显,客户对于服务的需求增多,要求也提高,这就给人工服务提出了更大的挑战。
客服很多时候都是在跟客户之间是问答的这种形式,客户有问题问,客服马上回答。其实在电商的客服里面有很多的应用,有的时候可以注意一下,问客服的时候可能不在,但是会给一些常用的回复,还会引导,在不用自己人工参与下去找到答案,这种就越来越代替人工的客服,这种就叫以用户需求为导向的智能问答,已经逐步的形成一套完善的信息服务系统,能够满足客户的服务需求。它除了有代替人工的优势之外,还可以二十四小时在线,它的回答是不会错误的。如果把它训练得智能一点,它的回答还可以有不同的风格。
(2)快速检索的领域
基于信息检索的问题的回答,可以在网页或者文档集合里面快速的查找短文本,来满足用户的即问即答的需求。这方面有的搜索引擎已经在尝试,用语音跟交互的时候,可能会找到认为最好的答案,然后马上告诉。但是要注意这里讲的快速检索,不仅是搜索引擎,有可能内部是有一个自己的知识系统的,不是公开在互联网上的,它可能也是非常重要。
比如说公司内部去使用的时候,也可以用这种快速问答的方式迅速地找到文档或者短的文本段,马上来找到需求。有一些类似的系统做得很好,比如说阿里云,它背后得有很多的资料,在进行查询的时候,它的搜索引擎有的时候不需要把全部的内容都给你,然后再打开链接,问的问题,直接把一个文本段地找过来,然后就回答了,加快了用户的反馈的速度,提升用户的体验。
五、总结
通过本节的学习,我们学到了:
1、文本分类技术介绍与应用
对文本按照一定的分类标准进行自动分类标记,利用待分类数据的特征与类别进行匹配,选择最优的匹配结果作为分类结果
2、情感分析技术介绍与应用
对带有情感色彩的主观性文本进行分析、处理、归纳和推理,将每一个新的单词与字典中的词汇进行匹配,根据匹配结果提高或降低文本得分
3、文本纠错技术介绍与应用
文本纠错就是将文本中有错误的地方进行纠正,错误类型包含错别字、缺失字、冗余字、词语搭配错误和语法错误等
4、问答系统技术介绍与应用
能够对于一个指定问题,能够得到简短、精确的答案,包含分析问题、检索答案和提取答案3个步骤