正则化技术的选择和超参数优化:简单神经网络处理表格数据

简介: 正则化技术的选择和超参数优化:简单神经网络处理表格数据

论文标题:Regularization is all you Need:Simple Neural Nets can Excel on Tabular Data


论文链接:https://arxiv.org/abs/2106.11189


一、概述


一直以来,传统的机器学习方法,如GBDT,由于其优越的性能,在表格数据应用中占主导地位,而深度学习在一些其他类型的数据(如图像、语音和文本)方面取得了成功。然而在表格数据方面,深度网络模型的效果却始终没能战胜传统机器学习方法。虽然有一些文献提供了一些深度学习方法,并且宣称其战胜了GBDT,然而其他文献也证明了GBDT仍然是最有效的方法。


本文在40个数据集上的广泛实验证明了这些深度模型的方法的确未能战胜GBDT。本文假设解决神经网络在表格数据上的性能问题的关键在于利用深度学习在正则化技术上的最新进展,比如数据增强(data  augmentation)、残差块(residual blocks)、模型平均(model averaging)等。本文发现同时应用多种正则化技术时,即使普通的多层感知机也能够达到SOTA的结果。


对于经常混合使用正则化技术的从业者来说,联合应用多个正则化器并不是一种新鲜的做法。不过一个更深层次的问题尚未解决,那就是:在多种可用方法中,在特定的数据集上正则化器的哪个子集具有最大的泛化性能?目前从业者选择正则化技术仅仅是通过简单的试错。在本文中,我们提供了一个方法,能够以13个现代正则化技术及其附属超参数作为候选,为每个数据集寻找MLP正则化器的最佳组合。


本文的成果证明了一个好的正则化神经网络能够在表格数据上战胜最近的一些深度学习方法以及GBDT。本文的主要贡献为:


①证明了为其他类型的数据(如图像、语音和文本)开发的现代正则化技术同样能够提高神经网络模型在表格数据上的性能;


②提出了一个简单而有原则的范式来选择正则化技术的最优子集及其附属超参数(称其为regularization cocktails);


③证明了regularization cocktails甚至能够使得简单MLP战胜最近的一些深度学习方法以及GBDT,并且在本文设计的公平的大规模实验中表明神经网络战胜了XGBoost。


二、方法


  1. 正则化技术


本文涉及的正则化技术以及包括以下几个大类:


①Weight decay:L1,L2,……;

②Data Augmentation:Cut-Out,Mix-Up,Aug-Mix,……;

③Model Averaging:Dropout,snapshot ensembles,……;

④Structural and Linearization:Skip Connection,……;

⑤一些隐式的正则化方法:Batch Normalization,early stopping,……


  1. 问题定义


(5HOY)SBBKX8]B_HC1B@3K7.png

1G(}VD4AC6W8JXIVK1KZJLP.png


  1. 搜索空间


本文从前面提到的几大类中的一共13种正则化器中进行选择,下表列出了这些正则化器以及控制它们的19个超参数:


R(%$1T%URFZ~)DMDF0W8V59.png

                                            正则化器


超参数优化采用BOHB方法,具体过程见文章附录。


三、实验


本文在40个表格数据集上进行了大规模实验,对比了多个baseline,包括深度学习的方法与GBDT,实验结果如下:


4N])[[4F@DTVHVS(C6@JXDG.png

                                                     实验


同时也对比了与三个效果最好的baseline的错误率:


3LMRWKS@$OOD`86J)P~J%KV.png

                                                    对比baseline


为了评估统计显著性,文章分析了40个数据集的分类精度等级。文章使用了基于Wilcoxon显著性检验的等级的临界差分(CD)图,这是在多个数据集上比较分类器的标准度量:


4UY6A8IA}7%8S7S]V_OF]LI.png

                       Critical difference diagrams


具体实验设置参看原文。

相关文章
|
3天前
|
安全 云计算 网络安全
云计算与网络安全:技术融合与挑战
本文将探讨云计算与网络安全的关联性,重点分析云服务在提供便利的同时如何应对网络安全威胁。我们将深入讨论信息安全的关键技术领域,包括数据加密、身份验证和访问控制等,以及这些技术如何在云环境中得到应用和发展。此外,我们还将探讨云计算面临的主要安全挑战,并提出相应的解决方案。
|
5天前
|
机器学习/深度学习 安全 网络安全
云计算与网络安全:技术融合的未来
本文深入探讨了云计算与网络安全的紧密联系,分析了云服务、网络安全和信息安全等技术领域的现状与挑战。文章首先介绍了云计算的基本概念和服务模型,然后详细讨论了网络安全的重要性以及在云计算环境中面临的安全威胁。接着,文章探讨了信息安全的关键技术和策略,最后展望了技术融合的未来发展趋势。
|
5天前
|
存储 监控 安全
云计算与网络安全:技术挑战与解决方案
【5月更文挑战第31天】本文深入探讨了云计算与网络安全的交叉领域,分析了云服务、网络安全、信息安全等技术领域的关键问题。文章首先介绍了云计算的基本概念和主要服务模型,然后详细讨论了云计算环境下的网络安全威胁和挑战,最后提出了一些有效的解决方案和技术策略。
|
1天前
|
Java 程序员 Linux
网络编程套接字(3)——Java数据报套接字(UDP协议)
网络编程套接字(3)——Java数据报套接字(UDP协议)
4 0
|
2天前
|
存储 安全 网络安全
云计算与网络安全:技术融合的双刃剑
【6月更文挑战第3天】随着云计算技术的飞速发展,其在提供便捷服务的同时,也带来了前所未有的网络安全挑战。本文深入探讨了云服务中的网络安全问题,分析了信息安全的重要性,并提出了相应的技术解决方案,旨在平衡技术创新与安全防护之间的关系,确保云计算的健康发展。
32 0
|
4天前
|
5G 安全 SDN
【计算巢】网络切片技术:5G 网络的核心创新
【6月更文挑战第2天】5G时代的变革核心技术——网络切片,如同万能钥匙,可根据不同应用场景定制专属网络服务。通过虚拟化逻辑网络,满足各类行业个性化需求,如自动驾驶的低延迟连接或远程手术的安全传输。实现网络切片涉及NFV和SDN等技术,虽面临动态管理、安全隔离等挑战,但其潜力巨大,将推动各行各业的数字化转型,成为社会进步的关键驱动力。
|
4天前
|
缓存 UED
【计算巢】移动网络优化技巧:提升用户体验的关键
【6月更文挑战第1天】在数字化时代,移动网络已成为生活必需,但网络问题时常影响用户体验。本文探讨了移动网络优化技巧,包括理解网络基本原理、增强信号强度、避免网络拥堵及示例代码演示如何监听和管理网络状态。通过这些方法,可以提升网络效率和稳定性,优化用户体验。
【计算巢】移动网络优化技巧:提升用户体验的关键
|
5天前
|
存储 安全 网络安全
网络安全与信息安全:保护数据安全的关键技术与意识
在数字化时代,网络安全与信息安全已经成为社会发展和个人生活中不可或缺的重要组成部分。本文探讨了网络安全漏洞、加密技术以及安全意识等方面的知识,并阐述了它们在保护数据安全中的关键作用。通过加强对网络安全与信息安全的认识与应对,我们可以更好地应对日益复杂的网络威胁,保障个人和组织的数据安全。
|
22天前
|
机器学习/深度学习 算法 PyTorch
python手把手搭建图像多分类神经网络-代码教程(手动搭建残差网络、mobileNET)
python手把手搭建图像多分类神经网络-代码教程(手动搭建残差网络、mobileNET)
60 0
|
22天前
|
机器学习/深度学习 自然语言处理 数据可视化
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化