正则化技术的选择和超参数优化:简单神经网络处理表格数据

简介: 正则化技术的选择和超参数优化:简单神经网络处理表格数据

论文标题:Regularization is all you Need:Simple Neural Nets can Excel on Tabular Data


论文链接:https://arxiv.org/abs/2106.11189


一、概述


一直以来,传统的机器学习方法,如GBDT,由于其优越的性能,在表格数据应用中占主导地位,而深度学习在一些其他类型的数据(如图像、语音和文本)方面取得了成功。然而在表格数据方面,深度网络模型的效果却始终没能战胜传统机器学习方法。虽然有一些文献提供了一些深度学习方法,并且宣称其战胜了GBDT,然而其他文献也证明了GBDT仍然是最有效的方法。


本文在40个数据集上的广泛实验证明了这些深度模型的方法的确未能战胜GBDT。本文假设解决神经网络在表格数据上的性能问题的关键在于利用深度学习在正则化技术上的最新进展,比如数据增强(data  augmentation)、残差块(residual blocks)、模型平均(model averaging)等。本文发现同时应用多种正则化技术时,即使普通的多层感知机也能够达到SOTA的结果。


对于经常混合使用正则化技术的从业者来说,联合应用多个正则化器并不是一种新鲜的做法。不过一个更深层次的问题尚未解决,那就是:在多种可用方法中,在特定的数据集上正则化器的哪个子集具有最大的泛化性能?目前从业者选择正则化技术仅仅是通过简单的试错。在本文中,我们提供了一个方法,能够以13个现代正则化技术及其附属超参数作为候选,为每个数据集寻找MLP正则化器的最佳组合。


本文的成果证明了一个好的正则化神经网络能够在表格数据上战胜最近的一些深度学习方法以及GBDT。本文的主要贡献为:


①证明了为其他类型的数据(如图像、语音和文本)开发的现代正则化技术同样能够提高神经网络模型在表格数据上的性能;


②提出了一个简单而有原则的范式来选择正则化技术的最优子集及其附属超参数(称其为regularization cocktails);


③证明了regularization cocktails甚至能够使得简单MLP战胜最近的一些深度学习方法以及GBDT,并且在本文设计的公平的大规模实验中表明神经网络战胜了XGBoost。


二、方法


  1. 正则化技术


本文涉及的正则化技术以及包括以下几个大类:


①Weight decay:L1,L2,……;

②Data Augmentation:Cut-Out,Mix-Up,Aug-Mix,……;

③Model Averaging:Dropout,snapshot ensembles,……;

④Structural and Linearization:Skip Connection,……;

⑤一些隐式的正则化方法:Batch Normalization,early stopping,……


  1. 问题定义


(5HOY)SBBKX8]B_HC1B@3K7.png

1G(}VD4AC6W8JXIVK1KZJLP.png


  1. 搜索空间


本文从前面提到的几大类中的一共13种正则化器中进行选择,下表列出了这些正则化器以及控制它们的19个超参数:


R(%$1T%URFZ~)DMDF0W8V59.png

                                            正则化器


超参数优化采用BOHB方法,具体过程见文章附录。


三、实验


本文在40个表格数据集上进行了大规模实验,对比了多个baseline,包括深度学习的方法与GBDT,实验结果如下:


4N])[[4F@DTVHVS(C6@JXDG.png

                                                     实验


同时也对比了与三个效果最好的baseline的错误率:


3LMRWKS@$OOD`86J)P~J%KV.png

                                                    对比baseline


为了评估统计显著性,文章分析了40个数据集的分类精度等级。文章使用了基于Wilcoxon显著性检验的等级的临界差分(CD)图,这是在多个数据集上比较分类器的标准度量:


4UY6A8IA}7%8S7S]V_OF]LI.png

                       Critical difference diagrams


具体实验设置参看原文。

相关文章
|
1天前
|
SQL 安全 算法
网络安全与信息安全:防御前线的关键技术与策略
【5月更文挑战第17天】 在数字化时代,数据成为新的货币,而网络安全则是保护这些宝贵资产不受威胁的盾牌。本文将深入探讨网络安全漏洞的本质、加密技术的最新进展以及提升个人和企业安全意识的有效方法。通过对这些关键领域的分析,我们旨在提供一套综合性的策略和工具,以帮助读者构建更为坚固的网络安全防线。
|
1天前
|
SQL 安全 物联网
网络安全与信息安全:防御前线的关键技术与策略
【5月更文挑战第17天】在数字化时代,网络安全与信息安全已成为维护网络空间稳定的核心。本文深入探讨了网络安全漏洞的成因、加密技术的重要性以及提升安全意识的必要性。通过对现有安全威胁的分析,文章提出了一系列防御措施和策略,旨在帮助个人和组织构建更加稳固的安全防线。
|
1天前
|
算法 网络安全 Python
sqlmap性能优化_sqlmap 优化 不接受请求体,阿里巴巴网络安全面试题答案
sqlmap性能优化_sqlmap 优化 不接受请求体,阿里巴巴网络安全面试题答案
|
1天前
|
算法
MATLAB|【免费】融合正余弦和柯西变异的麻雀优化算法SCSSA-CNN-BiLSTM双向长短期记忆网络预测模型
这段内容介绍了一个使用改进的麻雀搜索算法优化CNN-BiLSTM模型进行多输入单输出预测的程序。程序通过融合正余弦和柯西变异提升算法性能,主要优化学习率、正则化参数及BiLSTM的隐层神经元数量。它利用一段简单的风速数据进行演示,对比了改进算法与粒子群、灰狼算法的优化效果。代码包括数据导入、预处理和模型构建部分,并展示了优化前后的效果。建议使用高版本MATLAB运行。
|
1天前
|
SQL 安全 网络安全
网络安全与信息安全:防御前线的关键技术与意识
【5月更文挑战第17天】在数字化时代,数据成为了新的货币,而网络安全则是保护这些资产不受威胁的保险箱。本文深入探讨了网络安全漏洞的概念、加密技术的重要性以及提升个人和企业的安全意识的必要性。通过分析当前网络环境中存在的风险,我们提出了一系列预防措施和应对策略,旨在帮助读者构建一个更加安全的数字生活和工作环境。
|
1天前
|
机器学习/深度学习 人工智能 安全
网络安全与信息安全:保护数据的关键策略
【5月更文挑战第17天】在数字化时代,网络安全和信息安全已成为维护个人和企业资产的核心。本文将深入探讨网络安全漏洞的概念、加密技术的重要性以及提升安全意识的必要性。我们将分析当前网络环境中的安全挑战,介绍最新的加密方法,并分享如何培养强大的安全文化,以减少潜在的网络攻击和数据泄露风险。
|
2天前
|
缓存 监控 UED
CDN(内容分发网络):加速网站加载与优化用户体验
CDN(内容分发网络):加速网站加载与优化用户体验
|
2天前
|
存储 安全 网络安全
网络安全与信息安全:防御前线的技术与意识
【5月更文挑战第16天】在数字化时代,网络安全与信息安全是维护信息完整性、确保数据流通安全的关键。本文深入探讨了网络安全漏洞的概念、加密技术的应用以及提升个人和企业的安全意识的重要性,旨在为读者提供全面的网络安全知识框架。通过对常见安全威胁的分析,我们展示了现代网络防御策略的必要性,并强调了持续教育和技术创新在保护信息资产中的核心作用。
|
3天前
|
安全 网络安全 数据安全/隐私保护
网络安全与信息安全:保护您的数据和隐私
【5月更文挑战第14天】本文将探讨网络安全漏洞、加密技术和安全意识等方面,以帮助读者更好地了解如何保护他们的数据和隐私。我们将讨论各种类型的网络攻击,以及如何使用加密技术来保护信息。此外,我们还将强调培养良好的安全习惯的重要性,以降低遭受网络攻击的风险。
|
3天前
|
安全 网络协议 网络安全
网络安全与信息安全:保护你的数据,保护你的未来
【5月更文挑战第14天】在数字化的世界中,网络安全和信息安全是每个互联网用户都必须面对的问题。本文将深入探讨网络安全漏洞、加密技术以及安全意识等方面的知识,帮助读者更好地理解和保护自己的数据。我们将讨论如何识别和防范网络安全威胁,如何使用加密技术来保护数据,以及如何提高自己的安全意识,从而在网络世界中更安全地生活。

热门文章

最新文章