什么是ablation study(消融实验)?

简介: 什么是ablation study(消融实验)?

本文是对学术概念“ablation study(消融实验)”一词的介绍。


在深度学习论文中,ablation study往往是在论文最终提出的模型上,减少一些改进特征(如减少几层网络等),以验证相应改进特征的必要性。

(一般在跑ablation study的时候发现去掉改进效果更好的情况也是常有的)


以Topic-Oriented Spoken Dialogue Summarization for Customer Service with Saliency-Aware Topic Modeling一文举例论文是我随手挑的,我没仔细看,其ablation study部分:

image.png


在本文提出的TDS+SATM模型的基础上,ablation study比较了原模型与分别去掉(w/o是without的意思)customer utterances上的topic modeling、agent utterances上的topic modeling和都去掉后的实验效果,最后发现本文提出的模型效果最好,证明了模型的这些组成部分是有效的。


以下介绍一些ablation study概念之外的补充知识:


这个quora问题下的回答https://qr.ae/pGLSRk给出了另一个典型示例:LSTM模型一共有4个门,去掉一些门→GRU

此外本链接还提及,如果去掉一些特征后模型效果基本没变,就应该用更简单的模型(我认为应该是根据奥卡姆剃刀原理)。


在这个知乎回答什么是 ablation study? - 尼箍纳斯凯奇的回答 - 知乎下的评论中提及“消融实验”这一概念的可能来源:


这个用法很可能是从神经科学借来的。有许多实验是通过损伤(ablate)一个或多个特定的神经元来研究它们的功能。


这个回答什么是 ablation study? - 谢小六的回答 - 知乎介绍了“消融实验”源于20世纪实验心理学领域,其中动物的大脑部分被移除以研究其对其行为的影响,对应概念在Oxford reference上的详细解释:Ablation experiment - Oxford Reference

这一概念被机器学习界重视,则始自 Keras 深度学习框架的主要作者 Francois Chollet 在2018年6月发布的推文,强调ablation study对因果分析的意义:


Ablation studies are crucial for deep learning research – can’t stress this enough. Understanding causality in your system is the most straightforward way to generate reliable knowledge (the goal of any research). And ablation is a very low-effort way to look into causality.


相关文章
overleaf 插入图片,引用图片,图标标题Fig与文章引用Figure不一致解决
overleaf 插入图片,引用图片,图标标题Fig与文章引用Figure不一致解决
12757 1
|
5月前
|
存储 弹性计算 运维
阿里云轻量应用服务器和云服务器区别——ECS和轻量如何选择?
阿里云轻量应用服务器简化易用,适合个人及轻量场景;ECS功能强大、弹性灵活,适用于企业级复杂业务。根据需求选择:轻量型选SWAS,高性能选ECS。
|
5月前
|
供应链 安全 算法
什么是数据要素?一文带你认识数据要素全流程
数据正从成本负担转向核心生产要素。本文结合实例,解析“数据要素化”全过程:从内部治理、产品封装到流通交易,揭示企业如何将沉睡数据变为可创造新价值的资产,并提供落地路径与关键技术支撑。
|
SQL 关系型数据库 MySQL
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
MySQL慢查询优化、索引优化,是必知必备,大厂面试高频,本文深入详解,建议收藏。关注【mikechen的互联网架构】,10年+BAT架构经验分享。
大厂面试官:聊下 MySQL 慢查询优化、索引优化?
|
机器学习/深度学习 算法
广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术
广义优势估计(GAE)由Schulman等人于2016年提出,是近端策略优化(PPO)算法的核心理论基础。它通过平衡偏差与方差,解决了强化学习中的信用分配问题,即如何准确判定历史动作对延迟奖励的贡献。GAE基于资格迹和TD-λ思想,采用n步优势的指数加权平均方法,将优势函数有效集成到损失函数中,为策略优化提供稳定梯度信号。相比TD-λ,GAE更适用于现代策略梯度方法,推动了高效强化学习算法的发展。
2509 3
广义优势估计(GAE):端策略优化PPO中偏差与方差平衡的关键技术
|
机器学习/深度学习 自然语言处理 算法
【Transformer系列(1)】encoder(编码器)和decoder(解码器)
【Transformer系列(1)】encoder(编码器)和decoder(解码器)
7771 0
【Transformer系列(1)】encoder(编码器)和decoder(解码器)
|
机器学习/深度学习 资源调度 自然语言处理
长短时记忆网络(LSTM)完整实战:从理论到PyTorch实战演示
长短时记忆网络(LSTM)完整实战:从理论到PyTorch实战演示
20901 0
|
机器学习/深度学习 编解码 TensorFlow
MobileNetV3架构解析与代码复现
MobileNet模型基于深度可分离卷积,这是一种分解卷积的形式,将标准卷积分解为深度卷积和`1*1`的点卷积。对于MobileNet,深度卷积将单个滤波器应用于每个输入通道,然后,逐点卷积应用`1*1`卷积将输出与深度卷积相结合。
3743 0
MobileNetV3架构解析与代码复现
|
机器学习/深度学习 人工智能 自然语言处理
【强化学习】强化学习的概述及应用,附带代码示例
强化学习(Reinforcement Learning, RL)是机器学习中的一种重要范式,它通过让智能体(agent)在环境中采取行动并根据所获得的奖励(reward)来学习最优的策略(policy)。简而言之,强化学习的目标是让智能体学会在特定环境下做出决策,以最大化累积奖励。这种学习方式模拟了生物体如何在环境给予的正反馈(奖励)和负反馈(惩罚)中学习行为的过程。
3689 4