《短文本数据理解(1)》一2.5 小结

简介:

本节书摘来自华章出版社《短文本数据理解(1)》一书中的第2章,第2.5节,作者王仲远,更多章节内容可以访问云栖社区“华章计算机”公众号查看

2.5 小结

本章提出一个从多数据源提取属性并通过概率为属性打分的算法框架。同以往基于实体的方法不同,新的方法强调实体的歧义性,并与基于概念的模式聚合。这项工作创新地将两种模式结合在一起,并通过多重数据源获取属性,依靠Pairwise排序算法聚合属性得分。总而言之,本工作能得到严谨而实用的属性典型度得分,用以支持上层短文本理解推理。

相关文章
|
4月前
|
自然语言处理 数据可视化 算法
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
R语言文本挖掘、情感分析和可视化哈利波特小说文本数据
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
【一起从0开始学习人工智能0x02】字典特征抽取、文本特征抽取、中文文本特征抽取
【一起从0开始学习人工智能0x02】字典特征抽取、文本特征抽取、中文文本特征抽取
76 1
|
机器学习/深度学习 自然语言处理 安全
将入学考试题搬进中文大模型数据集,20477道题目,还带4个候选答案
将入学考试题搬进中文大模型数据集,20477道题目,还带4个候选答案
172 0
|
机器学习/深度学习 自然语言处理 Ubuntu
维基百科的语料库下载以及信息提取笔记
维基百科的语料库下载以及信息提取笔记
|
自然语言处理
S-SimCSE:基于抽样子网络的句子嵌入对比学习
S-SimCSE:基于抽样子网络的句子嵌入对比学习
155 0
S-SimCSE:基于抽样子网络的句子嵌入对比学习
|
Java 编译器 Android开发
[短文速读] a=a+b和a+=b的区别
前言 短文速读,这将是一个系列文章。自己写了很多文章,也看了很多文章。发现很多都是收藏不看系列。当然有时间的时候,的确会把收藏的文章找出来好好的学习一番。
1250 0
|
算法
《 短文本数据理解》——2.5小结
本节书摘来自华章出版社《短文本数据理解》一书中的第2章,第2.5节,作者:王仲远 编著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.5小结 本章提出一个从多数据源提取属性并通过概率为属性打分的算法框架。
1343 0
|
机器学习/深度学习 自然语言处理 搜索推荐
《 短文本数据理解》——导读
当今世界,每天都有数十亿的短文本产生,比如搜索查询、广告关键字、标签、微博、问答、聊天记录等。与长文本(如文档)不同,短文本具有如下特性:首先,短文本通常不遵守语法规则;其次,短文本由于字数少,本身所包含的信息也较少。
3501 0
|
大数据
《短文本数据理解(1)》一导读
为此我们意识到,缺少基础性工作和原始积累,就难以培养符合工业界需要的大数据复合型和交叉型人才。因此急需在思维和理念方面进行转变,为现有的课程和知识体系按大数据应用需求进行延展和补充,加入新的可以因材施教的知识模块。我们肩负着大数据时代知识更新的使命,每一位学者都有责任和义务去为此“增砖添瓦”。
1268 0