正则化技术的选择和超参数优化:简单神经网络处理表格数据

简介: 正则化技术的选择和超参数优化:简单神经网络处理表格数据

论文标题:Regularization is all you Need:Simple Neural Nets can Excel on Tabular Data


论文链接:https://arxiv.org/abs/2106.11189


一、概述


一直以来,传统的机器学习方法,如GBDT,由于其优越的性能,在表格数据应用中占主导地位,而深度学习在一些其他类型的数据(如图像、语音和文本)方面取得了成功。然而在表格数据方面,深度网络模型的效果却始终没能战胜传统机器学习方法。虽然有一些文献提供了一些深度学习方法,并且宣称其战胜了GBDT,然而其他文献也证明了GBDT仍然是最有效的方法。


本文在40个数据集上的广泛实验证明了这些深度模型的方法的确未能战胜GBDT。本文假设解决神经网络在表格数据上的性能问题的关键在于利用深度学习在正则化技术上的最新进展,比如数据增强(data  augmentation)、残差块(residual blocks)、模型平均(model averaging)等。本文发现同时应用多种正则化技术时,即使普通的多层感知机也能够达到SOTA的结果。


对于经常混合使用正则化技术的从业者来说,联合应用多个正则化器并不是一种新鲜的做法。不过一个更深层次的问题尚未解决,那就是:在多种可用方法中,在特定的数据集上正则化器的哪个子集具有最大的泛化性能?目前从业者选择正则化技术仅仅是通过简单的试错。在本文中,我们提供了一个方法,能够以13个现代正则化技术及其附属超参数作为候选,为每个数据集寻找MLP正则化器的最佳组合。


本文的成果证明了一个好的正则化神经网络能够在表格数据上战胜最近的一些深度学习方法以及GBDT。本文的主要贡献为:


①证明了为其他类型的数据(如图像、语音和文本)开发的现代正则化技术同样能够提高神经网络模型在表格数据上的性能;


②提出了一个简单而有原则的范式来选择正则化技术的最优子集及其附属超参数(称其为regularization cocktails);


③证明了regularization cocktails甚至能够使得简单MLP战胜最近的一些深度学习方法以及GBDT,并且在本文设计的公平的大规模实验中表明神经网络战胜了XGBoost。


二、方法


  1. 正则化技术


本文涉及的正则化技术以及包括以下几个大类:


①Weight decay:L1,L2,……;

②Data Augmentation:Cut-Out,Mix-Up,Aug-Mix,……;

③Model Averaging:Dropout,snapshot ensembles,……;

④Structural and Linearization:Skip Connection,……;

⑤一些隐式的正则化方法:Batch Normalization,early stopping,……


  1. 问题定义


(5HOY)SBBKX8]B_HC1B@3K7.png

1G(}VD4AC6W8JXIVK1KZJLP.png


  1. 搜索空间


本文从前面提到的几大类中的一共13种正则化器中进行选择,下表列出了这些正则化器以及控制它们的19个超参数:


R(%$1T%URFZ~)DMDF0W8V59.png

                                            正则化器


超参数优化采用BOHB方法,具体过程见文章附录。


三、实验


本文在40个表格数据集上进行了大规模实验,对比了多个baseline,包括深度学习的方法与GBDT,实验结果如下:


4N])[[4F@DTVHVS(C6@JXDG.png

                                                     实验


同时也对比了与三个效果最好的baseline的错误率:


3LMRWKS@$OOD`86J)P~J%KV.png

                                                    对比baseline


为了评估统计显著性,文章分析了40个数据集的分类精度等级。文章使用了基于Wilcoxon显著性检验的等级的临界差分(CD)图,这是在多个数据集上比较分类器的标准度量:


4UY6A8IA}7%8S7S]V_OF]LI.png

                       Critical difference diagrams


具体实验设置参看原文。

相关文章
|
3月前
|
存储 监控 安全
单位网络监控软件:Java 技术驱动的高效网络监管体系构建
在数字化办公时代,构建基于Java技术的单位网络监控软件至关重要。该软件能精准监管单位网络活动,保障信息安全,提升工作效率。通过网络流量监测、访问控制及连接状态监控等模块,实现高效网络监管,确保网络稳定、安全、高效运行。
86 11
|
2月前
|
边缘计算 容灾 网络性能优化
算力流动的基石:边缘网络产品技术升级与实践探索
本文介绍了边缘网络产品技术的升级与实践探索,由阿里云专家分享。内容涵盖三大方面:1) 云编一体的混合组网方案,通过边缘节点实现广泛覆盖和高效连接;2) 基于边缘基础设施特点构建一网多态的边缘网络平台,提供多种业务形态的统一技术支持;3) 以软硬一体的边缘网关技术实现多类型业务网络平面统一,确保不同网络间的互联互通。边缘网络已实现全球覆盖、差异化连接及云边互联,支持即开即用和云网一体,满足各行业需求。
|
3月前
|
负载均衡 网络协议 网络性能优化
动态IP代理技术详解及网络性能优化
动态IP代理技术通过灵活更换IP地址,广泛应用于数据采集、网络安全测试等领域。本文详细解析其工作原理,涵盖HTTP、SOCKS代理及代理池的实现方法,并提供代码示例。同时探讨配置动态代理IP后如何通过智能调度、负载均衡、优化协议选择等方式提升网络性能,确保高效稳定的网络访问。
378 2
|
1月前
|
机器学习/深度学习 算法 文件存储
YOLOv11改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
YOLOv11改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
94 10
YOLOv11改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
|
4天前
|
缓存 监控 算法
基于 C# 网络套接字算法的局域网实时监控技术探究
在数字化办公与网络安全需求增长的背景下,局域网实时监控成为企业管理和安全防护的关键。本文介绍C#网络套接字算法在局域网实时监控中的应用,涵盖套接字创建、绑定监听、连接建立和数据传输等操作,并通过代码示例展示其实现方式。服务端和客户端通过套接字进行屏幕截图等数据的实时传输,保障网络稳定与信息安全。同时,文章探讨了算法的优缺点及优化方向,如异步编程、数据压缩与缓存、错误处理与重传机制,以提升系统性能。
21 2
|
25天前
|
机器学习/深度学习 算法 文件存储
RT-DETR改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
RT-DETR改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
34 4
RT-DETR改进策略【模型轻量化】| MoblieNetV3:基于搜索技术和新颖架构设计的轻量型网络模型
|
7天前
|
监控 安全 网络安全
静态长效代理IP的技术创新与网络安全体现在哪些方面?
随着数字化发展,网络安全和隐私保护成为核心需求。静态长效代理IP通过智能路由、动态IP池管理、加密技术、负载均衡及API集成等创新,提升数据传输速度与安全性。它在信息安全保护、访问控制、数据传输保护及网络监控等方面发挥重要作用,为各行业提供高效、安全的网络解决方案,应用前景广阔。
26 4
|
3月前
|
机器学习/深度学习 算法
基于改进遗传优化的BP神经网络金融序列预测算法matlab仿真
本项目基于改进遗传优化的BP神经网络进行金融序列预测,使用MATLAB2022A实现。通过对比BP神经网络、遗传优化BP神经网络及改进遗传优化BP神经网络,展示了三者的误差和预测曲线差异。核心程序结合遗传算法(GA)与BP神经网络,利用GA优化BP网络的初始权重和阈值,提高预测精度。GA通过选择、交叉、变异操作迭代优化,防止局部收敛,增强模型对金融市场复杂性和不确定性的适应能力。
226 80
|
8天前
|
缓存 小程序 API
微信小程序网络请求与API调用:实现数据交互
本文深入探讨了微信小程序的网络请求与API调用,涵盖`wx.request`的基本用法、常见场景(如获取数据、提交表单、上传和下载文件)及注意事项(如域名配置、HTTPS协议、超时设置和并发限制)。通过一个简单案例,演示了如何实现小程序与服务器的数据交互。掌握这些技能将帮助你构建功能更丰富的应用。
|
2月前
|
存储 人工智能 安全
AI时代的网络安全:传统技术的落寞与新机遇
在AI时代,网络安全正经历深刻变革。传统技术如多因素身份认证、防火墙和基于密码的系统逐渐失效,难以应对新型攻击。然而,AI带来了新机遇:智能化威胁检测、优化安全流程、生物特征加密及漏洞管理等。AI赋能的安全解决方案大幅提升防护能力,但也面临数据隐私和技能短缺等挑战。企业需制定清晰AI政策,强化人机协作,推动行业持续发展。
80 16

热门文章

最新文章