中国人工智能学会通讯——面向知识图谱的自然语言问答系统 1 信息检索式的知识库问答

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介:

1 信息检索式的知识库问答

信息检索式的方法通常先确定问题的中心实体,继而生成问题的若干候选答案,再使用打分、排序等方式找出最适合原问题的答案。这类方法的整体框架比较简洁,对于简单问题有较好的效果。

1.1 确定中心实体

信息检索式的方法通常假设问题足够简单,大多数系统认为问题中有且仅有一个实体,这个实体被称作中心实体(Topic Entity),这是用户输入自然语言问题的核心,同时假设问题答案在知识图谱中离中心实体足够近,例如在离中心实体θ步以内(θ通常取2)。例如问题“What is the budget of Resident Evil? ”的中心实体是Resident Evil,疑问词是What。对于较复杂的问题,这类方法通常使用启发式规则和模板将复杂问题分解成若干简单问题,依次处理简单问题再对各答案集合求交集。

确定中心实体的本质任务是实体识别(Entity Recognition),其目标是检测出自然语言问题中代表实体的短语,并进一步将这些短语映射到特定的实体上。后一步工作常被称作实体连接(Entity Linking)或者实体消歧。若识别出多个实体,通常选择其中置信度最高的实体,或依次作为中心实体进行后续步骤。

在确定中心实体后,自然语言问题就在知识图中有了一个定位。由于问题规模有限,通常假设答案在知识图中离中心实体的距离足够近。这样,一种简单直观的方法就是将中心实体θ步之内的邻居节点都作为候选答案(θ通常取2)。

1.2 问题答案排序

确定中心实体,以及候选答案后,需要给各候选答案进行评分或排序,从而决定最终的结果。这是基于信息检索方式的问答系统重要阶段。评分或排序的方法包括基于特征抽取的方法[3],也包括基于深度学习的Graph Embedding的方法[4]。

用来计算答案最终得分的特征多种多样,这些特征通常从实体、关系和答案三个角度出发。与实体相关的特征主要包括实体链接的置信度,实体的表征短语和实体之间的单词重叠数等。与关系相关的特征主要包括关系抽取的置信度,关系两侧可以接受的类型等。与答案相关的特征主要包括答案的数目、答案的类型等。除此之外,不同的问答系统还可能考虑各自独有的特征。在计算出候选答案的特征之后,需要使用某种排序模型进行排序,以选择最合适的结果。排序学习(Learningto Rank)在信息抽取(Information Retrieval)领域中已经受到广泛关注和系统研究[14],主要分为单文档方法(PointWise Approach)、文档对方法(PairWise Approach)和文档列表方法(ListWise Approach)。其中文档对方法将排序问题转化为分类问题,在KB-QA任务中的表现较好,一些较成熟的算法可以直接使用,例如SVM-rank[15]。

另一方面,一些系统利用神经网络和各类Embedding的方法,直接评价候选答案与原问题之间的匹配程度。文献[1]将候选答案和原问题分别向量化,再使用多通道卷积神经网络(MCCNN)计算候选答案与原问题之间的相似度。文献[2]将候选实体生成与关系抽取(Relation Extraction)结合起来,利用原问题的上下文信息,使用卷积神经网络为候选实体对应的关系进行打分。文献[4]将候选答案周围的边和节点一同作为子图进行Embedding,再与原问题的向量做点乘作为得分(如图2所示)。

image

相关文章
|
2月前
|
人工智能 JSON 数据格式
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
【9月更文挑战第6天】RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
RAG+Agent人工智能平台:RAGflow实现GraphRA知识库问答,打造极致多模态问答与AI编排流体验
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】TF-IDF算法在人工智能方面的应用,附带代码
TF-IDF算法在人工智能领域,特别是自然语言处理(NLP)和信息检索中,被广泛用于特征提取和文本表示。以下是一个使用Python的scikit-learn库实现TF-IDF算法的简单示例,并展示如何将其应用于文本数据。
256 65
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
【自然语言处理】python之人工智能应用篇——文本生成技术
文本生成是指使用自然语言处理技术,基于给定的上下文或主题自动生成人类可读的文本。这种技术可以应用于各种领域,如自动写作、聊天机器人、新闻生成、广告文案创作等。
100 8
|
3月前
|
人工智能 安全 Anolis
中兴通讯分论坛邀您探讨 AI 时代下 OS 的安全能力 | 2024 龙蜥大会
操作系统如何提供符合场景要求的安全能力,构建更加安全可信的计算环境。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
智能时代的桥梁:自然语言处理技术在人工智能中的应用
随着人工智能技术的飞速发展,自然语言处理(NLP)作为其核心领域之一,已广泛应用于多个行业。本文将深入探讨NLP的基本概念、关键技术以及其在现代AI系统中的应用实例,旨在揭示NLP如何成为连接人类与机器的桥梁,推动智能技术向前迈进。
83 1
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理和人工智能有什么区别
自然语言处理和人工智能有什么区别
297 2
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能浪潮下的自然语言处理技术演进
本文从自然语言处理(NLP)技术的历史发展出发,深入剖析了在人工智能(AI)大潮中该领域的创新突破。我们将探讨深度学习如何推动语言模型的革新、多语言处理技术的发展,以及机器翻译和语音识别的最新进展。文章还将讨论这些技术进步如何影响社会,并展望未来NLP技术的潜力与挑战。
100 0
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理(Natural Language Processing,NLP)是人工智能领域的一个重要分支,旨在使计算机能够理解、处理和生成人类语言。
自然语言处理(Natural Language Processing,NLP)是人工智能领域的一个重要分支,旨在使计算机能够理解、处理和生成人类语言。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
自然语言处理(NLP)是人工智能和语言学的一个交叉领域,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
自然语言处理(NLP)是人工智能和语言学的一个交叉领域,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
|
4月前
|
SQL 人工智能 自然语言处理
一款利用人工智能将自然语言查询转换为 SQL 代码的互译工具 - SQL Translator
一款利用人工智能将自然语言查询转换为 SQL 代码的互译工具 - SQL Translator
113 0

热门文章

最新文章