2019 到目前为止的深度学习研究进展汇总

简介: 在刚刚结束的2019年的第一季度里,深度学习技术在快速的向前发展。
TB1j55ma.KF3KVjSZFEXXXExFXa.jpg

本文为 AI 研习社编译的技术博客,原标题 :

Best Deep Learning Research of 2019 So Far

作者 | ODSC - Open Data Science

翻译 | 敬爱的勇哥     编辑 | 酱番梨、邓普斯•杰弗

原文链接:

https://medium.com/@ODSC/best-deep-learning-research-of-2019-so-far-7bea0ed22e38

TB1G99ma.CF3KVjSZJnXXbnHFXa.png

在刚刚结束的2019年的第一季度里,深度学习技术在快速的向前发展。我经常会去查看相关研究人员的工作,以便了解这项技术的进展。这项工作让我能够了解到很多我不知道的事情,然后以此优化自己的工作时间安排。因此,尽管该领域每周会有成百上千篇论文,我也会要求自己每周至少阅读一篇研究论文。

在本文中,将2019年以来已经发表的论文整理出来列在下面,这将帮你节省很大一部分时间。下文中的所有文章,在Github中都有相应的代码。让我们开始奇妙之旅!

1.使用PyTorch Geometric快速开始图形表征学习

本研究介绍了一个名为PyTorch Geometric的学习库,它基于PyTorch构建,可以帮助我们直接使用图形,点云以及流形数据等不规则的数据结构。除了一般的图形数据结构和处理方法外,它还包含了许多最近发表的关系学习和三维数据处理的方法。PyTorch Geometric通过使用稀疏GPU加速、提供专用的CUDA内核以及为不同大小的输入样本提供高效的小型批处理来实现高数据吞吐量。该文的代码可以在GitHub找到。 

https://arxiv.org/abs/1903.02428v2

相关文章:Most Influential Data Science Research Papers for 2018

2.Mask Scoring R-CNN  

在实例分割任务中,大多数实例分割框架都使用实例分类置信度作为掩码的质量分数。本文研究的这个问题,提出了一种包含网络块的R-CNN掩码评分方法来学习和预测实例掩码的质量。掩码评分策略对比掩码质量和掩码得分之间的不一致,在COCO AP评测指标上,优先考虑更准确的掩码预测来改进实例分割的性能。代码可以在GitHub上找到。  

https://arxiv.org/abs/1903.00241v1

3.用更少的标注生成高保真图像(High-Fidelity Image Generation with Fewer Labels)  

深度生成模型正在成为现代机器学习的基础。最近关于条件生成对抗网络(conditional generative adversarial networks,GANs)的研究表明,在自然图像上学习复杂的高维分布是可行的。虽然最新的模型能够在高分辨率下生成高保真度、多样化的自然图像,但它们依赖于大量的标注数据。这篇论文展示了如何从最新的自我和半监督学习研究中获得启发,从而在无监督的图像合成和条件设置方面都优于当前的最好效果(SOTA)。代码可以在GitHub上找到。 

https://arxiv.org/abs/1903.02271v1

4.GCNv2:实时SLAM的高效匹配预测 (GCNv2: Efficient Correspondence Prediction for Real-Time SLAM)

这篇文章提出了一种基于深度学习的关键字和描述符生成网络GCNv2,它基于为三维投影几何而训练的GCN而来。GCNv2设计了一个二进制描述符向量作为ORB特征,以便在诸如ORB-slam等系统中方便的替换ORB。代码可以在GitHub上找到。 

https://arxiv.org/abs/1902.11046v1

相关文献:Deep Learning for Text Classification

5.ALiPy:使用Python进行主动学习(ALiPy: Active Learning in Python)

有监督的机器学习方法通常需要大量带标签的数据来进行模型训练。然而,在许多实际应用中,有大量的未标记数据,但标记数据却有限,而且对它们进行标注的成本很高。主动学习(Active learning,AL)通过迭代地在标注器中通过查询的方式选择最合适的标签,从而降低了标注成本。本文介绍了一个用于主动学习的Python库ALiPy。代码可以在GitHub上找到。

https://arxiv.org/abs/1901.03802v1

6.DeepFashion2:一个用于服装图像检测、姿态估计、分割和重新识别的多用途标注(DeepFashion2: A Versatile Benchmark for Detection, Pose Estimation, Segmentation and Re-Identification of Clothing Images)

通过带有丰富标签的数据集(如DeepFashion,其标签包括服装类别、标注点和消费者信息图像对),可以加强对时装图像的理解。然而,DeepFashion存在一些不可忽视的问题,比如每张图片只有一件衣服,稀疏的标注点(只有4~8个)以及没有每个像素的掩码,这与现实场景有很大的差距。本文通过DeepFashion2来解决这些问题,填补了这一空白。DeepFashion2是一个通用的标签库,包括四个任务,包括服装检测,姿态估计,分割和检索。代码可以在GitHub上找到。  

https://arxiv.org/abs/1901.07973v1

7.星际争霸多端挑战  (The StarCraft Multi-Agent Challenge)

近年来,深度多端强化学习(RL)已经成为一个非常活跃的研究领域。在这一领域,有一类特别的问题很有挑战,就是部分可观察的、可以合作的、多智能体的学习,在这种学习中,团队必须学会只以他们各自的观察为条件进而协调整体的行为。这是一个很有吸引力的研究方向,因为这类问题涉及大量的真实系统,而且比一般总和博奕问题更易于评估。然而,对于可协作的多端RL,目前还没有可对比的基准。因此,这一领域的大多数论文都使用一次性的游戏,很难衡量真正的进展。本文将星际争霸多智能挑战(SMAC)作为一个基准问题来填补这一空白。代码可以在GitHub上找到。  

https://arxiv.org/abs/1902.04043v2

8.Dropout是随机增量规则(SDR)的一个特例:更快、更准确的深度学习(Dropout is a special case of the stochastic delta rule: faster and more accurate deep learning)

多层神经网络在文本、语音和图像处理等多种任务中取得了很好的效果。在分层模型中,非线性参数估计容易出现过拟合和错误设置的问题。对这些参数估计错误以及其他相关问题(局部极小值、共线性、特征提取等)的一种解决方法称为Dropout。Dropout会根据概率为p的伯努利随机分布,在每次更新前随机删除部分隐藏层的单元,从而对网络产生随机的“扰动”,并在每次更新时对其进行平均。本文指出,Dropout是发表于1990年的通用模型随机增量规则(Stochastic Delta Rule,SDR)的一种特例。代码可以在GitHub上找到。 

https://arxiv.org/abs/1808.03578v2

9.Lingvo:一种用于序列模型的模块化和可伸缩框架( Lingvo: a Modular and Scalable Framework for Sequence-to-Sequence Modeling)

Lingvo是一个Tensorflow框架,为深度学习研究尤其是序列化模型提供了一个完整的解决方案,它由灵活且易于扩展的模块化构建块组成,实验时可以集中配置且可高度定制。该框架支持分布式训练和量化推理,包含大量实用组件、辅助函数和最新研究论文的实现。在过去的两年里,Lingvo已经被数十名研究人员用在了20多篇论文里。本文概述了Lingvo的底层设计,并对框架各个部分进行了介绍,同时还对框架的高级特性提供了示例。代码可以在GitHub上找到。  

https://arxiv.org/abs/1902.08295v1

10.具有动态学习率边界的自适应梯度方法(Adaptive Gradient Methods with Dynamic Bound of Learning Rate)

为了加快深度学习的训练速度,人们提出了如AdaGrad, RMSProp和Adam等学习率自适应优化方法。虽然方法众多,但与SGD相比,它们的泛化能力较差,甚至由于不稳定和极端的学习率而无法收敛。本文论证了极端的学习率会导致模型性能变差。基于Adam和AMSGrad分别提出了名为AdaBound和AMSBound的变种,它们利用学习率的动态边界实现了从自适应方法到SGD的渐进平稳过渡,并给出了收敛性的理论证明。对各种常见的任务和模型进行了进一步的实验,实验结果表明,新的方法能够消除自适应方法与SGD之间的泛化差距,同时在训练初期保持较高的学习速度。代码可以在GitHub上找到。  雷锋网雷锋网(公众号:雷锋网)雷锋网

https://openreview.net/forum?id=Bkg3g2R9FX

想要继续查看该篇文章相关链接和参考文献?

点击【2019 到目前为止的深度学习研究进展汇总】即可访问哦~

为了营造更好学习氛围,AI研习社向你推荐“PyTorch的深度教程”

TB1OE5sa8Cw3KVjSZFlXXcJkFXa.png

这是作者编写的一系列深入的教程,可用于通过令人惊叹的PyTorch库自己实现很酷的深度学习模型。如果你刚开始接触PyTorch,请先阅读PyTorch的深度学习:60分钟闪电战和学习PyTorch的例子。在每个教程中,我们将通过从研究论文中实施模型来关注特定应用或感兴趣的领域。比如文本分类(代码已创建完成,教程正在进行)、机器翻译物体检测等。

教程链接:https://ai.yanxishe.com/page/tweet/22260

目录
相关文章
|
4月前
|
机器学习/深度学习 数据可视化 网络架构
增强深度学习模型的可解释性和泛化能力的方法研究
【8月更文第15天】在深度学习领域,模型的准确率和预测能力是衡量模型好坏的重要指标。然而,随着模型复杂度的增加,它们往往变得越来越难以理解,这限制了模型在某些关键领域的应用,例如医疗诊断、金融风险评估等。本文将探讨如何通过几种方法来增强深度学习模型的可解释性,同时保持或提高模型的泛化能力。
442 2
|
2月前
|
机器学习/深度学习 调度 计算机视觉
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
本文探讨了多种学习率调度策略在神经网络训练中的应用,强调了选择合适学习率的重要性。文章介绍了阶梯式衰减、余弦退火、循环学习率等策略,并分析了它们在不同实验设置下的表现。研究表明,循环学习率和SGDR等策略在提高模型性能和加快训练速度方面表现出色,而REX调度则在不同预算条件下表现稳定。这些策略为深度学习实践者提供了实用的指导。
50 2
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
|
6月前
|
机器学习/深度学习 数据采集 算法
未来研究将深入探索深度学习的应用及数据质量与安全问题
【6月更文挑战第13天】本文探讨了使用Python和机器学习预测股票价格的方法,包括数据收集与预处理(填充缺失值、处理异常值、标准化)、特征选择(技术指标、基本面指标、市场情绪)、模型选择与训练(线性回归、SVM、神经网络等)、模型评估与调优。尽管股票价格受多重因素影响,通过不断优化,可构建预测模型。未来研究将深入探索深度学习的应用及数据质量与安全问题。
65 5
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的自适应学习算法研究与应用
在深度学习领域,传统的静态模型在处理动态环境和非平稳数据时面临挑战。本文探讨了自适应学习算法在深度学习中的重要性及其应用。通过分析自适应学习算法在模型参数、损失函数和数据分布上的应用,展示了其在提升模型鲁棒性和泛化能力方面的潜力。具体讨论了几种代表性的自适应学习方法,并探索了它们在现实世界中的应用案例,从而展示了其在处理复杂问题和动态数据中的效果。
249 0
|
2月前
|
机器学习/深度学习 搜索推荐 算法
深度学习-点击率预估-研究论文2024-09-14速读
深度学习-点击率预估-研究论文2024-09-14速读
47 0
|
4月前
|
机器学习/深度学习 算法 PyTorch
PyTorch Lightning:简化深度学习研究与开发
【8月更文第27天】PyTorch Lightning 是一个用于简化 PyTorch 开发流程的轻量级封装库。它的目标是让研究人员和开发者能够更加专注于算法和模型的设计,而不是被训练循环和各种低级细节所困扰。通过使用 PyTorch Lightning,开发者可以更容易地进行实验、调试和复现结果,从而加速研究与开发的过程。
152 1
|
4月前
|
机器学习/深度学习 存储 搜索推荐
Elasticsearch与深度学习框架的集成案例研究
Elasticsearch 是一个强大的搜索引擎和分析引擎,广泛应用于实时数据处理和全文搜索。深度学习框架如 TensorFlow 和 PyTorch 则被用来构建复杂的机器学习模型。本文将探讨如何将 Elasticsearch 与这些深度学习框架集成,以实现高级的数据分析和预测任务。
41 0
|
5月前
|
机器学习/深度学习 人工智能 安全
深度学习中的对抗性样本研究
在深度学习技术飞速发展的今天,对抗性样本作为一项重要的安全议题,引起了研究者们的广泛关注。对抗性样本指的是经过精心设计的、能够误导深度学习模型做出错误判断的输入数据。本文将深入探讨对抗性样本的生成机制、防御策略以及对未来深度学习安全性的影响,同时通过实验数据分析,揭示对抗性攻击对模型性能的具体影响,旨在为深度学习的安全性研究提供理论依据和实践指导。 【7月更文挑战第19天】
67 2
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
基于深度学习的自然语言处理技术研究与进展
基于深度学习的自然语言处理技术研究与进展
111 1
|
7月前
|
机器学习/深度学习 存储 边缘计算
基于深度学习的图像识别优化策略研究
【5月更文挑战第25天】 在当前的人工智能研究领域,图像识别技术因其广泛的应用前景而备受关注。本文针对深度学习模型在处理高维图像数据时所遇到的计算量大、资源消耗高等问题,提出了一种结合模型压缩和知识蒸馏技术的图像识别优化策略。通过深入分析现有深度学习模型的瓶颈,并融合轻量化网络结构设计原则,我们实现了模型性能与效率的平衡。实验结果表明,该优化策略在保证识别准确率的同时,显著降低了模型的复杂度和运行成本,为边缘计算设备上的实时图像识别应用提供了可行的解决方案。