每周论文清单:知识图谱,文本匹配,图像翻译,视频对象分割

简介:


[ 自然语言处理 ]


Knowledge Graph Embedding: A Survey of Approaches and Applications
@jerryshi 推荐
Knowledge Graph

本文对当下流行的 Knowledge Graph Eembedding 进行汇总,主要介绍了两大类,Translational Distance Models 和 Semantic Matching Models,简要叙述了每中方式下的算法。最后又给出了 KG Embedding 的一些应用,包括 KG 内部知识补全及外部的关系抽取、QA、推荐等。

论文链接
https://www.paperweekly.site/papers/1425


Parallel WaveNet: Fast High-Fidelity Speech Synthesis
@wuhecong 推荐
Deep Learning

DeepmMind 17 年 11 月份的论文,wavenet 的改良版本,实现了并行文本转语音。可以和百度的 Deep Voice 3 对比一下。

论文链接
https://www.paperweekly.site/papers/1416


Deconvolutional Latent-Variable Model for Text Sequence Matching
@zhangjianhai 推荐
Sentence Matching

利用 Convolution encoder - Deconvolution decoder 学习句子的语义表示,将 cnn-deconv 框架用于文本匹配任务中,如 Text Entailment、Paraphrase Identification 任务中,generation 和 discriminative 共同训练,提升特定任务的效果。

该论文方法优势是可以利用 unlabeled 数据帮助学习句子表示,当数据不足时非常有效,随着标注数据的增加,优势逐渐减小。

论文链接
https://www.paperweekly.site/papers/1387


Exploring the Effectiveness of Convolutional Neural Networks for Answer Selection in End-to-End Question Answering
@longquan 推荐
QA System

本文尝试探索了从整个端到端问答系统的流程的角度去衡量卷积神经网络对于答案选择任务的有效性。使用的数据集是标准的 TrecQA 数据集。

论文链接
https://www.paperweekly.site/papers/1400


Attention-based LSTM for Aspect-level Sentiment Classification
@applenob 推荐
Sentiment Classification

使用基于 Attention 的 LSTM 解决细粒度的情感分析问题,在 SemEval 2014 上取得 state-of-art 的结果。

论文链接
https://www.paperweekly.site/papers/1359


[ 计算机视觉 ]


Learning a Wavelet-like Auto-Encoder to Accelerate Deep Neural Networks
@Aidon 推荐
Neural Networks

文章提出一种加速 DNNs 的新方法(WAE: wavelet-like auto-encoder)来克服现有方法中存在的一个主要问题:如何保证网络加速而又不损失网络性能。

MAE 借助小波的思想,在 encoding 阶段利用 CNNs 分别提取图像的低频分量和高频分量,在 decoding 阶段利用这两个分量恢复出原始图像。

训练好 MAE 之后,可以用于提取图像的低频分量和高频分量,比如在图像分类任务中,将低频分量输入到标准的分类 DNNs(如 VGG-16,ResNet)中,然后与高频分量融合后一起用于分类。

这里提高效率的关键在于,相比于原始图像,提取的低频分量和高频分量都是低分率(原始图像的 1/4)的。

论文链接
https://www.paperweekly.site/papers/1413


Data Poisoning
@snowwalkerj 推荐
Face Recognition

Targeted Backdoor Attacks on Deep Learning Systems Using
在不直接接触模型和训练样本的前提下,只使用极少量的“污染样本”来迷惑模型,达到攻击(伪装)指定类别的目的。攻击者可以通过佩戴特定的装饰来达到把自己伪装成某个特定目标的目的。

论文链接
https://www.paperweekly.site/papers/1384


Data Distillation: Towards Omni-Supervised Learning
@corenel 推荐
Unsupervised Learning

本文来自 Facebook AI Research,提出了一种利用单一模型来 ensemle 不同 encoded features 来进行 self=training 的方法,就结果上来说很不错,值得一看。

论文链接
https://www.paperweekly.site/papers/1380


Toward Multimodal Image-to-Image Translation
@duinodu 推荐
Image-to-image Translation

在很多 image-to-image 问题中,one-to-many 是大部分情况,而一般方法比如 pix2pix,仅仅能产生 one-to-one 的结果,但似乎 one-to-many 更符合常理。比如一张灰色的图,对应的彩色图片应该有很多种方式,不仅仅是一种。

困难在于,GAN 总是会让 G 产生某几种固定的模式输出,而如果简单地在输入加随机噪声,G 会在 D 的判别下,忽略随机噪声的作用,还是会有 mode collapse 问题。

文章提出一种 bicycle 的方式,显式地对隐含变量 z 进行表示,处理 one-to-many 中的 mode collapse 问题。

论文链接
https://www.paperweekly.site/papers/1373


Video Object Segmentation with Re-identification
@chenhong 推荐
Video Object Segmentation

传统的视频分割方法依赖于生成掩膜的时间连续性,但是无法处理目标丢失或目较大的位移等情况。

论文为了克服这些问题,提出视频对象分割与重新识别( Video Object Segmentation with Re-identification,VSReID),包括掩码生成模块和 ReID 模块(Person re-identification,ReID,既给定一个监控行人图像,跨设备检索行人的图像)。

前者通过 flow warping 生成初始化概率图,后者自适应匹配检索丢失的目标实体。通过通过两个模块的迭代应用,本文的模型在 DAVIS-2017 取得冠军,验证了算法的性能。

论文链接
https://www.paperweekly.site/papers/1398

原文发布时间为:2017-12-27
本文作者:让你更懂AI的
本文来自云栖社区合作伙伴“PaperWeekly”,了解相关信息可以关注“PaperWeekly”微信公众号

相关文章
|
机器学习/深度学习 自然语言处理 算法
【文本摘要(1)】抽取式之textrank(无监督学习):生成200字以内摘要
【文本摘要(1)】抽取式之textrank(无监督学习):生成200字以内摘要
222 0
|
机器学习/深度学习 算法 自动驾驶
|
6月前
|
算法 数据处理 计算机视觉
论文介绍:基于点标注的实例分割
【5月更文挑战第24天】研究人员提出了一种创新的弱监督实例分割方法,通过点标注代替传统的像素级掩模标注,显著降低数据标注成本和时间。点标注方案只需在对象边界框内标注少量点,与Mask R-CNN兼容,实现接近全监督性能。改进的PointRend模块(Implicit PointRend)在点监督下表现出色,简化了模型设计。实验表明,使用10个点标注的Mask R-CNN能达到全监督模型的性能,为实例分割的实际应用开辟了新途径。尽管取得初步成功,但面临处理不同尺度对象和提高泛化能力的挑战。
70 4
|
人工智能 数据挖掘 PyTorch
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
VLE基于预训练文本和图像编码器的图像-文本多模态理解模型:支持视觉问答、图文匹配、图片分类、常识推理等
|
6月前
|
存储 传感器 编解码
CVPR 2023 最全分割类论文整理:图像/全景/语义/实例分割等【附PDF+代码】
CVPR 2023 最全分割类论文整理:图像/全景/语义/实例分割等【附PDF+代码】
981 1
bert知识库问答 实现建筑领域的问答匹配 文本相似性计算 完整代码数据
bert知识库问答 实现建筑领域的问答匹配 文本相似性计算 完整代码数据
100 0
|
机器学习/深度学习 自然语言处理 测试技术
【论文速递】CASE 2022 - EventGraph: 将事件抽取当作语义图解析任务
事件抽取涉及到事件触发词和相应事件论元的检测和抽取。现有系统经常将事件抽取分解为多个子任务,而不考虑它们之间可能的交互。
121 0
|
自然语言处理 达摩院 算法
长文本口语语义理解技术系列②:关键词抽取实践
长文本口语语义理解技术系列②:关键词抽取实践
232 0
长文本口语语义理解技术系列②:关键词抽取实践
|
机器学习/深度学习 自然语言处理 达摩院
长文本口语语义理解技术系列①:段落分割实践
长文本口语语义理解技术系列①:段落分割实践
752 0
|
机器学习/深度学习 编解码 算法
语义分割项目详解
语义分割项目详解
345 0
语义分割项目详解