《中国人工智能学会通讯》——6.6 实体消歧技术研究

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第6章,第6.6节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

6.6 实体消歧技术研究

实体是文本信息的重要承载,每一段有意义的文本都描述了一组实体及这些实体相互之间的关联和交互。识别并理解文本中的实体信息也就成为了自然语言理解的基础问题之一。

然而,文本中实体信息的理解存在两方面的挑战。首先,文本中的实体名通常具有歧义。例如,给定如下三个包含“苹果”的句子:

●  今 天 上 午 苹 果 由 乔 布 斯 发 布 了 新 一 代iPhone。
●  我早餐吃了一个苹果。
●  范冰冰在苹果中演的不错。

上述三个句子中的 “苹果”分别指向实体“苹果公司”、“水果苹果”及“电影苹果”。其次,实体的提及(mention)形式具有多样性,也就是人们可能会用不同的实体名来指向同一个实体。例如,在提到 IBM 公司时,人们可以使用 IBM、Big Blue 或 International Business MachinesCorporation 等不同名字。为解决实体名的歧义性和多样性问题,在许多应用中需要确定实体名所指向的真实世界实体,也就是实体消歧 (EntityDisambiguation)。图1展示了一个实体消歧的示例。image
随着大数据时代的到来,实体消歧已经成为了许多重要应用和任务的基础技术,在越来越多的地方发挥重要作用,例如:

知识图谱的构建和补全。自然语言理解和类人智能推理一直是人工智能的长期目标之一。然而上述两项任务都依赖于海量的世界知识,也就是知识图谱的帮助。通过识别知识图谱中特定实体在文本中的出现,同时发现文本中知识图谱未覆盖的实体,实体消歧在知识图谱的构建和补全上都起到重要作用。

基于知识的自然语言理解。近年来越来越多的智能信息服务(如苹果的智能手机助手 SIRI 和IBM 的 Watson 智能问答系统)依赖于海量自然语言文本的分析和理解。然而在过去几十年里,绝大多数计算机自然语言处理技术仅利用了句子的表层词法和句法信息[1] 。与之相对的是,人类理解自然语言会利用到许多语言深层信息,甚至很多外部世界知识[2-3] 。通过建立文本中实体名与知识图谱中真实世界实体之间的关联,实体消歧可以有效地在自然语言理解过程中引入知识图谱中存储的大量世界知识,从而为基于知识的自然语言理解奠定基础。

当前实体消歧的主流技术是实体链接 (EntityLinking) 技术,下面分别从任务、系统、主要技术挑战、发展趋势等多个方面来介绍实体链接。

相关文章
|
2天前
|
机器学习/深度学习 人工智能 物联网
智能家居技术的未来:从自动化到人工智能
本文探讨了智能家居技术的发展趋势,从早期的自动化设备到现在的人工智能集成系统。文章首先介绍了智能家居的基本概念和历史发展,然后详细分析了当前智能家居技术的主要特点,包括物联网、机器学习和用户交互界面。接着,文章讨论了智能家居技术面临的挑战,如隐私保护、数据安全和技术标准化问题。最后,展望了未来智能家居技术的发展方向,包括更加智能化的家居管理、环境自适应能力和高级用户定制服务。文章旨在为读者提供一个关于智能家居技术发展的全面视角,并引发对未来生活方式的思考。
|
10天前
|
人工智能 运维 自然语言处理
AI战略丨构建未来: 生成式人工智能技术落地策略
GenAI 的技术落地需要企业进行周密地规划和持续地努力。企业必须从自身的战略出发, 综合考虑成本、效果和性能,制定合理的技术架构,通过全面的 AI 治理,实现可持续的创新和发展。
|
8天前
|
存储 人工智能 算法
人工智能伦理与治理:在技术进步中寻求平衡
【9月更文挑战第4天】人工智能伦理与治理是一个复杂而重要的议题。在推动AI技术进步的同时,我们必须正视其带来的伦理与治理挑战,并寻求在技术进步中寻求平衡的策略。通过制定伦理准则与标准、加强法律与政策监管、提升算法透明度与可解释性、加强公众教育与参与以及推动国际合作与交流等措施,我们可以构建完善的伦理框架和治理体系,确保AI技术的发展和应用符合道德和社会价值观。
|
12天前
|
人工智能 算法 自动驾驶
人工智能浪潮下的道德困境与技术挑战
【8月更文挑战第31天】 在人工智能的飞速发展中,我们面临着前所未有的道德和技术问题。本文将探讨AI技术带来的伦理挑战,包括隐私保护、算法偏见和责任归属等问题,并分析当前技术发展面临的限制,如数据获取困难、模型泛化能力和人机交互的局限性。文章旨在启发读者思考如何在享受AI技术便利的同时,确保技术的健康发展和社会的公正性。
|
12天前
|
人工智能 安全 物联网
智能家居技术的未来:从自动化到人工智能的演变
随着技术的飞速发展,智能家居已经从简单的自动化控制进化到了集成人工智能的高级阶段。本文将探讨智能家居技术的发展轨迹,分析其如何通过人工智能、物联网和数据分析等技术提升家居生活的便利性、安全性和效率。我们将以实际案例说明未来智能家居的趋势,并讨论在实现这一愿景过程中所面临的挑战与机遇。
|
20天前
|
人工智能 自动驾驶 搜索推荐
人工智能浪潮之下,我们如何驾驭技术的未来
【8月更文挑战第22天】当AI技术如同潮水般涌入我们的生活,它不仅带来了便利,也引发了对未来的深思。本文将探讨AI技术的本质、影响及其未来的发展方向,同时引导读者思考如何在这场技术革命中找到自己的位置。
|
19天前
|
人工智能 搜索推荐 算法
探索未来技术:人工智能与日常生活的融合
【8月更文挑战第23天】本文将探讨人工智能(AI)如何逐步渗透到我们的日常生活中,并讨论这种技术融合对个人生活、工作和社会的潜在影响。通过分析AI在家居自动化、医疗保健和教育领域的应用示例,我们将了解AI如何提高效率、增强安全性以及个性化服务。同时,文章也会触及到随着AI技术发展所带来的伦理和社会问题,以及如何平衡创新与用户隐私之间的关系。最后,我们将展望未来,思考AI技术可能带来的变革和挑战。
|
2天前
|
机器学习/深度学习 人工智能 搜索推荐
AI技术在现代医疗领域的革命性应用
随着人工智能技术的飞速发展,其在医疗领域的应用也日益广泛。本文将从AI技术在医疗诊断、治疗和健康管理等方面的应用入手,探讨其如何改变传统医疗模式,提高医疗服务质量和效率。同时,我们也将关注AI技术在医疗领域面临的挑战和未来发展趋势。
|
1天前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
3天前
|
机器学习/深度学习 存储 人工智能
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
【9月更文挑战第1天】AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出
AI(文生语音)-TTS 技术线路探索学习:从拼接式参数化方法到Tacotron端到端输出