每日学术速递3.7

简介: 由 Hinton 等人介绍。2012 年,dropout 作为防止神经网络过度拟合的正则化项经受住了时间的考验。在这项研究中,我们证明了在训练开始时使用 dropout 也可以减轻欠拟合。在早期阶段,我们发现 dropout 减少了小批量梯度的方向方差,并有助于将小批量梯度与整个数据集的梯度对齐。这有助于抵消 SGD 的随机性并限制个别批次对模型训练的影响。

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理


Subjects: cs.CV


1.Dropout Reduces Underfitting

1698331e7148e7b83a862d4c1d897e16.png

标题:Dropout 减少欠拟合

作者:Zhuang Liu, Zhiqiu Xu, Joseph Jin, Zhiqiang Shen, Trevor Darrel

文章链接:https://arxiv.org/abs/2303.01500v1

项目代码:https://github.com/facebookresearch/dropout

6bc3d9ce161cbe7c887ccf129f277172.png

6e86fb6d2836b44dfe25c8b361af74a8.png

19d22228793cd3dfe0fd3fd18a739ff9.png

摘要:

       由 Hinton 等人介绍。2012 年,dropout 作为防止神经网络过度拟合的正则化项经受住了时间的考验。在这项研究中,我们证明了在训练开始时使用 dropout 也可以减轻欠拟合。在早期阶段,我们发现 dropout 减少了小批量梯度的方向方差,并有助于将小批量梯度与整个数据集的梯度对齐。这有助于抵消 SGD 的随机性并限制个别批次对模型训练的影响。我们的发现使我们找到了一种提高欠拟合模型性能的解决方案——早期退出:退出仅在训练的初始阶段应用,然后关闭。与没有 dropout 的模型相比,配备了 early dropout 的模型实现了更低的最终训练损失。此外,我们探索了一种用于正则化过拟合模型的对称技术 - 后期退出,其中退出在早期迭代中不使用,仅在后期训练中激活。在 ImageNet 和各种视觉任务上进行的实验表明,我们的方法不断提高泛化精度。我们的结果鼓励更多关于理解深度学习正则化的研究,我们的方法可以成为未来神经网络训练的有用工具,尤其是在大数据时代。

2.Self-Supervised Few-Shot Learning for Ischemic Stroke Lesion Segmentation

aeb9f8fbeac3fc6fed274826e356b850.png

标题:用于缺血性中风病灶分割的自监督小样本学习

作者:Luca Tomasetti, Stine Hansen, Mahdieh Khanmohammadi, Kjersti Engan, Liv Jorunn Høllesli, Kathinka Dæhli Kurz, Michael Kampffmeyer

文章链接:https://arxiv.org/abs/2303.01332v1

项目代码:https://github.com/biomedical-data-analysis-laboratory/adnet-for-ais-segmentation

a809811a19ace0e6e01a6e78ce1a83b4.png

fe9201ab31077019d3b0453f1a869bc4.png

摘要:

       精确的缺血性病灶分割在改善缺血性中风的诊断和治疗计划方面起着至关重要的作用,缺血性中风是死亡率最高的流行病之一。虽然最近提出了许多深度神经网络方法来解决这个问题,但这些方法在训练过程中需要大量的注释区域,这在注释数据稀缺的医学领域是不切实际的。作为一种补救措施,我们提出了一种原型的少镜头分割方法,用于在训练期间仅使用一个带注释的样本进行缺血性病变分割。所提出的方法利用了一种新颖的自我监督训练机制,该机制通过利用从计算机断层扫描灌注扫描生成的颜色编码参数图来适应缺血性中风病变分割的任务。我们说明了我们提出的训练机制的好处,从而在少镜头设置中显着提高了性能。给定一个带注释的患者,缺血性病变分割的平均 Dice 得分为 0.58。

3.The Learnable Typewriter: A Generative Approach to Text Line Analysis

e6a08f286f7cf52b8882d2130cb21b94.png

标题:基于匹配的术语语义预训练,用于理解患者的口语查询

作者:Zefa Hu, Xiuyi Chen, Haoran Wu, Minglun Han, Ziyi Ni, Jing Shi, Shuang Xu, Bo Xu

文章链接:https://arxiv.org/abs/2303.01341v1

项目代码:https://github.com/flyingcat-fa/tspmn

32c4254604d569470cea388451a23fa3.png

c78744677a5dee60304d8c92803c4a85.png

摘要:

       Medical Slot Filling (MSF) 任务旨在将医疗查询转换为结构化信息,在诊断对话系统中发挥重要作用。然而,缺乏足够的术语语义学习使得现有方法难以捕捉医学对话中语义相同但口语化的术语表达。在这项工作中,我们将 MSF 形式化为一个匹配问题,并提出了一个术语语义预训练匹配网络 (TSPMN),它将术语和查询作为输入来模拟它们的语义交互。为了更好地学习术语语义,我们进一步设计了两个自监督目标,包括对比术语识别(CTD)和基于匹配的掩码术语建模(MMTM)。CTD 判断每个给定的term 是否是对话中的masked term,而MMTM 直接预测masked 的。两个中国基准的实验结果表明,TSPMN 优于强基线,尤其是在少镜头设置中。

目录
相关文章
|
机器学习/深度学习 存储 自然语言处理
每日学术速递5.3
用任意语音音频生成说话人肖像是数字人和虚拟世界领域的一个关键问题。一种现代的说话人脸生成方法有望实现通用的音频-嘴唇同步、良好的视频质量和高系统效率的目标。
193 0
|
机器学习/深度学习 人工智能 自然语言处理
每日学术速递5.11
网页一直是视觉语言和纯语言任务的丰富、可扩展的资源。然而,只有网页的一部分被保留:图像标题对、长文本文章或原始 HTML,永远不会全部放在一个地方。
128 0
|
机器学习/深度学习 自然语言处理 计算机视觉
每日学术速递4.7
我们引入了一种新颖的框架,可以毫不费力地训练深度立体网络,无需任何基本事实。通过利用最先进的神经渲染解决方案,我们从使用单个手持相机收集的图像序列生成立体训练数据。
124 0
|
机器学习/深度学习 传感器 自然语言处理
每日学术速递4.23
神经辐射场 (NeRF) 能够以前所未有的视觉质量实现新颖的视图合成。然而,为了渲染逼真的图像,NeRF 需要对每个像素进行数百次深度多层感知器 (MLP) 评估。这是非常昂贵的,并且使实时渲染变得不可行,即使在强大的现代 GPU 上也是如此。
122 0
|
机器学习/深度学习 自然语言处理 数据可视化
每日学术速递4.19
最近,基于端到端变压器的检测器 (DETR) 取得了显着的性能。然而,DETRs 的高计算成本问题尚未得到有效解决,限制了它们的实际应用并阻止它们充分利用无后处理的好处,例如非最大抑制 (NMS)。在本文中,我们首先分析了现代实时目标检测器中 NMS 对推理速度的影响,并建立了端到端速度基准
159 0
|
传感器 机器学习/深度学习 人工智能
每日学术速递5.12
用户可以付费查询的大型语言模型 (LLM) 数量迅速增加。我们审查了与查询流行的 LLM API 相关的成本,例如GPT-4、ChatGPT、J1-Jumbo,并发现这些模型具有异构的定价结构,费用可能相差两个数量级。特别是,在大量查询和文本上使用 LLM 可能会很昂贵。
112 0
|
机器学习/深度学习 机器人
每日学术速递2.23
本文探讨了动态系统中的离散形态对称性,这是生物学和机器人系统的主要特征。当系统的形态具有一个或多个对称平面时,它表现出形态对称性,描述了身体部位的重复和平衡分布。这些形态对称性意味着系统的动力学是对称的(或近似对称的),这进而在最优控制策略和所有与系统动态演化相关的本体感知和外感知测量中印记了对称性。
69 0
|
机器学习/深度学习 自然语言处理 计算机视觉
每日学术速递4.18
我们介绍了 Delta Denoising Score (DDS),这是一种用于基于文本的图像编辑的新颖评分函数,可引导对输入图像进行最小程度的修改以实现目标提示中描述的内容。DDS 利用文本到图像扩散模型的丰富生成先验,可用作优化问题中的损失项,以将图像引导至文本指示的所需方向。DDS 利用分数蒸馏采样 (SDS) 机制来进行图像编辑。我们表明,仅使用 SDS 通常会由于嘈杂的梯度而产生不详细和模糊的输出。
182 0
|
机器学习/深度学习 自然语言处理 安全
每日学术速递2.24
在本技术报告中,我们介绍了百度 KDD 杯 2022 空间动态风电功率预测挑战赛的解决方案。风能是一种快速增长的清洁能源。准确的风电功率预测对于电网稳定和供应安全至关重要。为此,主办方提供了包含134台风电机组历史数据的风电数据集,并发起百度KDD Cup 2022,以检验当前风电预测方法的局限性。
167 0
|
机器人
每日学术速递4.27
我们研究如何使用 Transformers 构建和训练用于机器人决策的空间表示。特别是,对于在各种环境中运行的机器人,我们必须能够快速训练或微调机器人感觉运动策略,这些策略对杂波具有鲁棒性、数据效率高,并且可以很好地泛化到不同的环境。
108 0