Umang 谈部署可解释机器学习面临的挑战(上)

简介: 本文是由 Umang 博士分享关于 ML 可解释性方面面临的挑战。

在实践中如何使用现有的可解释性方法?

Umang 提到了围绕 XAI(可解释 AI)的文献大幅增长。特别是,旨在“解释”机器学习输出的提议算法的增加。有了这个观察结果,Umang 的团队着手做的事情之一就是研究组织如何使用这些算法


研究访谈

在他们的研究中,他们对来自 30 个不同组织的 50 人进行了半结构化访谈,访谈持续时间在 30 分钟到 2 小时之间。

共同语言

团队意识到需要共享和建立语言来思考可解释的人工智能,以便能够围绕该主题进行这些对话。 Umang 提供以下两个定义:

  • 透明度:向利益相关者提供有关模型如何工作的相关信息:这包括训练过程的文档、训练数据分布的分析、代码发布、特征级别说明等。
  • (本地)可解释性:提供对特定数据点的模型行为的洞察。

关键点在于,可解释性是一种实现透明的算法方法。


被问到的问题

一旦在访谈中建立了共同语言,受访者就会被问到以下问题:

  • 您使用了哪种类型的解释(例如,基于特征的、基于样本的、反设事实(Counterfactuals)的或自然语言)?
  • 谁是模型解释的受众(例如,研究科学家、产品经理、领域专家或用户)?
  • 您在什么情况下部署了模型解释(例如,告知开发过程,告知人类决策者有关模型的信息,或告知最终用户如何根据模型的输出采取行动)?


解释类型


Umang 和他的团队发现了一些非常流行的解释类型:

网络异常,图片无法展示
|


  • 特征重要性:使用相关性(重要)的特征,而不是相关性较小的特征(不重要),以做出正确的决策,并避免虚假相关性等误导性结论
  • 样本重要性:尝试回答“在预测新测试点时哪些训练数据点最有影响力?”这个问题。
  • 反设事实(Counterfactuals):试图回答“为了改变这个预测变量的结果,你需要改变自己的哪些方面?”这个问题。

谁在乎可解释性?

他们意识到的下一件事是,谁是对 ML 可解释性有既得利益的利益相关者:

网络异常,图片无法展示
|


  • 高管:团队发现公司的工程经理、首席数据科学家等曾有过这样的经历,他们的高管会要求他们开始使用可解释的机器学习,这样他们就可以说他们的公司使用可解释的机器学习。
  • 工程师:他们是最普遍的利益相关者。 ML 工程师和数据科学家使用这些可解释性技术来健全地检查他们的模型。
  • 最终用户:开发可消费的解释可以在最终用户和 AI 之间建立信任。
  • 监管机构:监管机构,如法律、外交官和研究界,对了解 XAI 如何工作以了解它如何影响周围社区具有既得利益。

研究的最终发现

最终,团队确定了该研究的 3 个关键发现。


可解释性用于内部调试

如前所述,可解释的 AI 主要由 ML 工程师使用。他们在现有流水线之上添加了这一层 XAI 来检查他们的模型。正如一些 XAI 文献所宣称的那样,这些系统无法到达最终用户。他们发现这些系统的主要场景是内容审核和金融。

网络异常,图片无法展示
|


可解释性的目标没有在内部定义

他们发现,重要的利益相关者从一开始就没有参与,这最终使得解释很难被真实的人理解。与这些利益相关者合作并定义这些解释的目的和作用,并建立可解释性的目标非常重要。

建立可解释性目标:识别利益相关者,让利益相关者参与,并设计工作流程。

网络异常,图片无法展示
|


技术限制使得可解释性难以实时部署

研究中经常出现一些限制。

  • 特征级别解释暴露的虚假相关性:如果我发现特征归因有问题,我该如何解决?
  • 模型本身没有因果关系:高管和监管者希望将事物放入模型中,并希望看到它对结果的影响:他们希望看到某种相关性。这些模型可能根本不是因果关系,而是支持这种产生相关性的系统。
  • 样本重要性在计算上无法大规模部署:哪些训练点与模型相似并产生相似的结果?这很难回答,尤其是在大规模上。
  • 模型反转的隐私问题是存在的:如果我能给你解释,我就可以反转你的模型,反转你的训练数据并重建它,这成为了一个巨大的隐私问题。


是否可以使用现有的可解释性工具来确保模型不公平?


Umang 强调的这一部分的关键(也有点令人沮丧)的要点是:

  • 特征重要性表明模型公平性并不可靠。

人们为什么要关心好的解释?

请注意来自 Umang 的以下示例。

  1. 具有相同精度的模拟模型(A、B),但模型 B 不重视年龄特征。
  2. 具有相同精度的模拟模型,但分配给不同特征的重要性不同。

网络异常,图片无法展示
|


这里有两个具有 3 个特征的模拟模型:

  1. 财富
  2. 年龄,以及
  3. 花费在做一些下游任务上的时间。

假设有人对他们使用相同的解释技术。第一个模型的解释将特征的重要性排列为时间>财富>年龄。 对第二个模型的解释将特征的重要性排序为时间>财富,年龄不重要

这些模型可以以相同的精度执行相同的操作,但它们的解释却大不相同。 理论上,监管者可以进来说模型 A 是不公平的,因为它使用了一个歧视性属性,即年龄。

网络异常,图片无法展示
|


这个问题引出了另一个问题:人们应该如何在不损失准确性的情况下将模型 A 转换为模型 B

试图影响解释

其实已经有一些工作涉及影响解释。本文探讨的解决方案是通过对参数的对抗性扰动来降级解释,以便作者可以隐藏不公平或歧视性的特征。或者简单地解释一下,攻击模型的参数,使得对某个特征(如年龄)的归因减少。


相关文章
|
2天前
|
机器学习/深度学习 数据采集 Python
从零到一:手把手教你完成机器学习项目,从数据预处理到模型部署全攻略
【10月更文挑战第25天】本文通过一个预测房价的案例,详细介绍了从数据预处理到模型部署的完整机器学习项目流程。涵盖数据清洗、特征选择与工程、模型训练与调优、以及使用Flask进行模型部署的步骤,帮助读者掌握机器学习的最佳实践。
11 1
|
3月前
|
监控 数据安全/隐私保护 异构计算
借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
【8月更文挑战第8天】借助PAI-EAS一键部署ChatGLM,并应用LangChain集成外部数据
85 1
|
3月前
|
机器学习/深度学习 数据采集 人工智能
揭秘大型机器学习模型背后的秘密:如何在技术深度与广度之间找到完美平衡点,探索那些鲜为人知的设计、训练与部署技巧,让你的作品脱颖而出!
【8月更文挑战第21天】大型机器学习模型是人工智能的关键方向,借助不断增强的计算力和海量数据,已实现在学术与产业上的重大突破。本文深入探讨大型模型从设计到部署的全过程,涉及数据预处理、模型架构(如Transformer)、训练技巧及模型压缩技术,旨在面对挑战时提供解决方案,促进AI技术的实用化进程。
66 1
|
3月前
|
机器学习/深度学习 监控 API
基于云计算的机器学习模型部署与优化
【8月更文第17天】随着云计算技术的发展,越来越多的数据科学家和工程师开始使用云平台来部署和优化机器学习模型。本文将介绍如何在主要的云计算平台上部署机器学习模型,并讨论模型优化策略,如模型压缩、超参数调优以及分布式训练。
567 2
|
3月前
|
机器学习/深度学习 JSON API
【Python奇迹】FastAPI框架大显神通:一键部署机器学习模型,让数据预测飞跃至Web舞台,震撼开启智能服务新纪元!
【8月更文挑战第16天】在数据驱动的时代,高效部署机器学习模型至关重要。FastAPI凭借其高性能与灵活性,成为搭建模型API的理想选择。本文详述了从环境准备、模型训练到使用FastAPI部署的全过程。首先,确保安装了Python及相关库(fastapi、uvicorn、scikit-learn)。接着,以线性回归为例,构建了一个预测房价的模型。通过定义FastAPI端点,实现了基于房屋大小预测价格的功能,并介绍了如何运行服务器及测试API。最终,用户可通过HTTP请求获取预测结果,极大地提升了模型的实用性和集成性。
225 1
|
3月前
|
开发者 算法 虚拟化
惊爆!Uno Platform 调试与性能分析终极攻略,从工具运用到代码优化,带你攻克开发难题成就完美应用
【8月更文挑战第31天】在 Uno Platform 中,调试可通过 Visual Studio 设置断点和逐步执行代码实现,同时浏览器开发者工具有助于 Web 版本调试。性能分析则利用 Visual Studio 的性能分析器检查 CPU 和内存使用情况,还可通过记录时间戳进行简单分析。优化性能涉及代码逻辑优化、资源管理和用户界面简化,综合利用平台提供的工具和技术,确保应用高效稳定运行。
67 0
|
3月前
|
前端开发 开发者 设计模式
揭秘Uno Platform状态管理之道:INotifyPropertyChanged、依赖注入、MVVM大对决,帮你找到最佳策略!
【8月更文挑战第31天】本文对比分析了 Uno Platform 中的关键状态管理策略,包括内置的 INotifyPropertyChanged、依赖注入及 MVVM 框架。INotifyPropertyChanged 方案简单易用,适合小型项目;依赖注入则更灵活,支持状态共享与持久化,适用于复杂场景;MVVM 框架通过分离视图、视图模型和模型,使状态管理更清晰,适合大型项目。开发者可根据项目需求和技术栈选择合适的状态管理方案,以实现高效管理。
40 0
|
3月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
全面解析TensorFlow Lite:从模型转换到Android应用集成,教你如何在移动设备上轻松部署轻量级机器学习模型,实现高效本地推理
【8月更文挑战第31天】本文通过技术综述介绍了如何使用TensorFlow Lite将机器学习模型部署至移动设备。从创建、训练模型开始,详细演示了模型向TensorFlow Lite格式的转换过程,并指导如何在Android应用中集成该模型以实现预测功能,突显了TensorFlow Lite在资源受限环境中的优势及灵活性。
158 0
|
3月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
TensorFlow Serving 部署指南超赞!让机器学习模型上线不再困难,轻松开启高效服务之旅!
【8月更文挑战第31天】TensorFlow Serving是一款高性能开源服务系统,专为部署机器学习模型设计。本文通过代码示例详细介绍其部署流程:从安装TensorFlow Serving、训练模型到配置模型服务器与使用gRPC客户端调用模型,展示了一站式模型上线解决方案,使过程变得简单高效。借助该工具,你可以轻松实现模型的实际应用。
41 0
|
3月前
|
机器学习/深度学习 数据采集 物联网
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
【机器学习】Google开源大模型Gemma2:原理、微调训练及推理部署实战
109 0