ECAI 2016论文精选 | 用于改善文字和文本嵌入的聚类驱动模型

简介:

ECAI 2016是欧洲展示AI科学成果的最佳场所,大会为研究人员提供了很好的机会,去介绍和听取当代最优秀的人工智能研究成果。

用于改善文字和文本嵌入的聚类驱动模型(Cluster-Driven Model for Improved Word and Text Embedding)

ECAI 2016论文精选 | 用于改善文字和文本嵌入的聚类驱动模型

摘要:大多数现有的文字嵌入模型只能考虑文字和与它相近语境之间的关系(例如,十字左右的目标文字)。然而,超越相近语义的信息(整体语境),反映了丰富的语义含义,而这通常都被忽略了。本文中,我们提出了一个通用的框架,利用全局信息学习单词和文本表示。我们的模型可以很容易地集成到现有的局部字嵌入模型,从而根据不同的下游任务引入不同程度的全局信息。此外,我们从共生矩阵的角度来看待我们的模型,在此基础上一种新的加权词-文档矩阵被因式分解以生成文本表示。我们进行了一系列的实验,来评估通过我们模型学习的单词和文本表示。实验结果显示我们的模型优于或者堪比最佳性能的模型。

本论文的原程序在https://github.com/zhezhaoa/cluster-driven

第一作者介绍

Zhe Zhao

中国人民大学信息学院

via:ECAI  2016

PS : 本文由雷锋网(公众号:雷锋网)独家编译,未经许可拒绝转载!

原论文下载

ECAI 2016论文精选 | 用于改善文字和文本嵌入的聚类驱动模型


本文作者:章敏

本文转自雷锋网禁止二次转载,原文链接

相关文章
|
10天前
|
测试技术
Vript:最为详细的视频文本数据集,每个视频片段平均超过140词标注 | 多模态大模型,文生视频
[Vript](https://github.com/mutonix/Vript) 是一个大规模的细粒度视频文本数据集,包含12K个高分辨率视频和400k+片段,以视频脚本形式进行密集注释,每个场景平均有145个单词的标题。除了视觉信息,还转录了画外音,提供额外背景。新发布的Vript-Bench基准包括三个挑战性任务:Vript-CAP(详细视频描述)、Vript-RR(视频推理)和Vript-ERO(事件时序推理),旨在推动视频理解的发展。
23 1
Vript:最为详细的视频文本数据集,每个视频片段平均超过140词标注 | 多模态大模型,文生视频
|
1月前
|
自然语言处理 PyTorch 算法框架/工具
视觉Transformers中的位置嵌入 - 研究与应用指南
视觉Transformers中的位置嵌入 - 研究与应用指南
41 0
|
4月前
|
机器学习/深度学习 人工智能 算法
AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢?
AI Earth有没有相关文档或论文介绍平台地物分类、目标提取、变化检测等算法的原理呢?
302 1
|
11月前
|
Web App开发 自然语言处理 图形学
自然语言融入NeRF,给点文字就生成3D图的LERF来了
自然语言融入NeRF,给点文字就生成3D图的LERF来了
112 0
|
11月前
|
机器学习/深度学习 图计算 图形学
NeurIPS 2022 | 文本图片编辑新范式,单个模型实现多文本引导图像编辑
NeurIPS 2022 | 文本图片编辑新范式,单个模型实现多文本引导图像编辑
297 0
|
11月前
|
机器学习/深度学习 自然语言处理 算法
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
CVPR 2022 | 大幅减少零样本学习所需的人工标注,马普所和北邮提出富含视觉信息的类别语义嵌入
|
11月前
|
算法 计算机视觉 网络架构
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(一)
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(一)
138 0
|
11月前
|
计算机视觉
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(二)
【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)(二)
52 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
多语种翻译,跨模态文档理解,视觉合成, Backbone... 12个去年刷爆基准的SOTA工作一文回顾
多语种翻译,跨模态文档理解,视觉合成, Backbone... 12个去年刷爆基准的SOTA工作一文回顾
107 0
|
11月前
|
机器学习/深度学习 自然语言处理 文字识别
多语种翻译,跨模态文档理解,视觉合成, Backbone... 12个去年刷爆基准的SOTA工作一文回顾(1)
多语种翻译,跨模态文档理解,视觉合成, Backbone... 12个去年刷爆基准的SOTA工作一文回顾
259 0

热门文章

最新文章