11.43 研究内容
基于前面对实体链接任务和其应用领域的介绍,可以看出实体链接任务是一项具有挑战性且非常有意义的基础研究工作。实体链接问题的解决对于知识库扩展、问答系统、信息提取、信息检索和内容分析等领域的发展具有巨大的促进作用。在这样的应用需求推动下,对随手可得的万维网数据中的实体进行有效、准确地链接显得尤为重要。
而万维网上的数据存在形式纷繁多样,有非结构化的自然语言文本(如新闻报道、博客文章等),有结构化的万维网实体列表或表格,有短小且低质的社交媒体微博文本,还有面向领域的领域文本(如计算机领域文本、金融领域文本、生物医疗领域文本等)。不同类型的万维网数据具有不同的特点,也需要针对其特点开发出不同算法以取得优异的链接效果。总体来说,本文提出了一系列针对万维网上异构数据的实体链接算法。