ICLR 2025 | 中科院+哈工大重磅发现:预训练视觉模型分类越准,可解释性越强

简介: 中科院、哈工大等团队在ICLR 2025发表研究,提出“内在可解释性评分”(IIS),发现预训练视觉模型分类越准,可解释性越强。通过IIS量化可解释性,实验证明高分类性能与高可解释性可兼得,甚至相互促进,打破传统认知。

ICLR 2025 | 中科院+哈工大重磅发现:预训练视觉模型分类越准,可解释性越强

论文标题:Enhancing Pre-trained Representation Classifiability can Boost its Interpretability

作者团队:中国科学院、哈尔滨工业大学、鹏城实验室、华为

发布时间:2025年10月28日

👉一键直达论文

👉Lab4AI大模型实验室论文阅读

✅Lab4AI平台提供AI导读和AI翻译等工具,辅助论文阅读。您还可以投稿复现这篇论文~

⭐研究背景

当前预训练视觉模型在分类任务上表现优异,但其表示的可解释性常被忽视。传统观点认为可解释性与分类性能存在冲突,尤其在设计可解释模型时分类性能往往下降。

⭐研究目的

本文旨在探究分类导向的预训练表示是否能够同时实现高分类性能和高可解释性,并量化表示的可解释性,揭示其与分类性能之间的内在关系。

⭐研究框架

提出“内在可解释性评分(IIS)”,通过将表示投影到概念空间并引入稀疏化机制,衡量其在解释过程中保留任务相关语义的能力。IIS定义为不同稀疏度下解释预测准确率与原始表示准确率之比的平均值。

⭐研究结果

实验发现,IIS与分类准确率呈正相关,即分类性能越高的表示越易于解释。进一步地,通过最大化IIS微调模型可提升其分类性能,同时基于解释的预测也能达到接近原始模型的准确率,实现可解释性与分类性能的协同提升。

相关文章
|
人工智能 自然语言处理 数据可视化
LLaMA Factory 微调实践:从零构建苏东坡角色扮演大模型
简介:本文介绍如何使用LLaMA-Factory框架微调苏东坡角色扮演大模型,涵盖数据准备、训练与评估全流程。通过Lab4AI平台可一键复现,快速构建具东坡文风的AI对话体,赋能文化、教育等场景。
149 0
|
SQL 关系型数据库 MySQL
MySQL数据库,可以使用二进制日志(binary log)进行时间点恢复
对于MySQL数据库,可以使用二进制日志(binary log)进行时间点恢复。二进制日志是MySQL中记录所有数据库更改操作的日志文件。要进行时间点恢复,您需要执行以下步骤: 1. 确保MySQL配置文件中启用了二进制日志功能。在配置文件(通常是my.cnf或my.ini)中找到以下行,并确保没有被注释掉: Copy code log_bin = /path/to/binary/log/file 2. 在需要进行恢复的时间点之前创建一个数据库备份。这将作为恢复的基准。 3. 找到您要恢复到的时间点的二进制日志文件和位置。可以通过执行以下命令来查看当前的二进制日志文件和位
1033 1
|
编解码 缓存 并行计算
YOLOv5入门实践(4)——手把手教你训练自己的数据集
YOLOv5入门实践(4)——手把手教你训练自己的数据集
3231 0
YOLOv5入门实践(4)——手把手教你训练自己的数据集
|
3月前
|
机器学习/深度学习 人工智能 测试技术
NeurIPS 2025|让AI读懂第一视角的“内心独白”!浙大等联合突破性实现自我中心视频推理
浙大等提出EgoThinker,首创支持第一视角视频推理的AI模型。构建500万问答对数据集EgoRe-5M,结合思维链与手物交互标注,通过两阶段训练提升时空定位与长时序因果推理能力,在多项基准超越现有模型,推动可穿戴助手与具身智能发展。
129 3
NeurIPS 2025|让AI读懂第一视角的“内心独白”!浙大等联合突破性实现自我中心视频推理
Python-素数
本文介绍了如何使用 Python 判断素数,并通过具体示例展示了求 100 以内及自定义范围内所有素数的方法。内容包括素数的定义、判断素数的底层逻辑和步骤,以及详细的代码演示。适合初学者参考学习。
|
编解码 中间件 API
API实现跨平台互操作性
【10月更文挑战第16天】API实现跨平台互操作性
420 2
|
前端开发 JavaScript 编译器
前端开发新视界:2024年的五大技术趋势
【10月更文挑战第3天】前端开发新视界:2024年的五大技术趋势
946 0
|
机器学习/深度学习 人工智能 数据可视化
还在用PPT做神经网络架构图?GitHub2万星项目,手把手教你从入门到可视化大师
现在搞机器学习的成本越来越低了,熟悉了Python和sklearn、Keras、Pytorch等机器学习框架,就能搭建自己的模型了,可是模型建好后如何解释给别人听,难倒了不少人。今天,我们就来介绍两款开源的机器学习画图工具,让你分分钟做出精美的可视化。
3201 0
还在用PPT做神经网络架构图?GitHub2万星项目,手把手教你从入门到可视化大师
|
安全 算法 编译器
【C++ 泛型编程 进阶篇】深入探索 C++ STL 容器的嵌套类型:识别、运用与最佳实践
【C++ 泛型编程 进阶篇】深入探索 C++ STL 容器的嵌套类型:识别、运用与最佳实践
426 7
|
API Python
在ModelScope中,访问令牌通常用于身份验证和授权
在ModelScope中,访问令牌通常用于身份验证和授权
553 2