《中国人工智能学会通讯》——7.22 知识图谱应用的基本技术

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第7章,第7.22节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

7.22 知识图谱应用的基本技术

要想在文本应用中使用知识图谱,必不可少的先决步骤是将知识图谱和文本对应起来。常用方法有实体标注(Entity Linking)和实体搜索(EntitySearch)两种。

实体标注
实体标注的任务是自动标识出文本里出现的实体。比如在“卡耐基梅隆大学是位于宾州匹兹堡的一所私立研究性大学”这句话里,实体标注系统会识别出它提到了“卡耐基梅隆”、“宾夕法尼亚”、“匹兹堡”和“研究性大学”这些实体,然后把它们链接到知识图谱的结点上。

一般来说现在的实体标注可以分为两步。

实体识别:识别出文本中可能提到实体的短语,然后找出知识图谱中可能被提到的实体们,作为候选集。

消歧:对每个第一步识别出的短语,从它的候选实体集合中选择出其中最可能的实体进行标注。

第一步一般是靠文本和实体名字的精确匹配。主要的难点在于搜集更全和更准确的实体名字列表。第二步是当前实体标注的研究的重点,常见的方法是整体考虑文本中所有的候选实体,从中利用图模型等,选择最可能的实体进行链接。比较经常使用的信号包括实体的重要性、实体和文本的相似度,以及实体们相互的相似度等[3-4] 。

实体搜索
给 定 一 个 查 询 词 条, 实 体 搜 索(EntitySearch)直接从知识图谱中搜索相关的实体们。实体搜索目前还是一个相对新的研究领域。现今的做法主要先把实体的相关信息转化为文档,然后再使用传统的文本搜索方法。从实体到文档的转化一般通过一些人工规则,把各种文本属性,例如名字、文本描述、类别,以及相关实体的名字等放到文档中,再运用经典的文本搜索方法,比如说 Learningto Rank [5] 进行实体搜索。

相关文章
|
6月前
|
人工智能 数据安全/隐私保护
如何识别AI生成内容?探秘“AI指纹”检测技术
如何识别AI生成内容?探秘“AI指纹”检测技术
1258 119
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
AI检测技术:如何识别机器生成的“数字指纹”?
AI检测技术:如何识别机器生成的“数字指纹”?
421 115
|
6月前
|
人工智能 自然语言处理 算法
揭秘AI文本:当前主流检测技术与挑战
揭秘AI文本:当前主流检测技术与挑战
1166 115
|
6月前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
6月前
|
人工智能 新制造
TsingtaoAI受邀参加宁波AI海曙科创训练营并分享技术落地实践
10月12日至15日,由宁波市海曙区组织部主办的AI海曙科创训练营在宁波成功举办。作为受邀企业代表,TsingtaoAI团队深入参与了多项活动,与政府领导、行业专家及科创企业代表围绕AI技术在制造业、成果转化等领域的实际应用展开交流,用真实案例诠释了“技术扎根产业”的价值逻辑。
192 2
|
6月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
2102 0
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
如何准确检测AI生成内容?这三大技术是关键
如何准确检测AI生成内容?这三大技术是关键
1077 116
|
6月前
|
人工智能 机器人 人机交互
当AI学会“看、听、懂”:多模态技术的现在与未来
当AI学会“看、听、懂”:多模态技术的现在与未来
449 117
|
6月前
|
机器学习/深度学习 人工智能 算法
AI生成内容的“指纹”与检测技术初探
AI生成内容的“指纹”与检测技术初探
1064 9