降低模型输出风险的三种方法(Valohai)

简介: 地球上的每一项业务和行为都包含风险,包括机器学习,或者更广泛地说人工智能也是如此。但是,出于多种原因,您公司的传统风险管理通常不会处理 AI 风险。首先,算法通常基于专有数据,模型和技术是在特定(业务)问题的领域范围内开发的。其次,算法可能是复杂的、不可预测的并且难以解释。最后,ML 场景相对较新,因此我们也缺乏最佳实践,同时,监管滞后。

我们需要通过解决我们如何开发这些算法以及我们如何在现实世界中应用这些算法来最小化风险

在本文中,我将重点介绍后一部分。换句话说,我将看看模型输出以及它们是如何使用的,因为有很多关于以数据为中心的 AI 以及如何确保你的模型是可解释的文献。不幸的是,预测的应用并不总是像应有的那样接近数据科学家。

网络异常,图片无法展示
|

您应该如何降低输出风险? 第一步是考虑是否需要机器学习。 与 ML 解决方案相比,由人工编写的业务规则风险更小,更易于解释。 如果这不可能,请考虑最不复杂的数据科学解决方案,例如:传统的、可解释(简单)的逻辑回归。

简单是好的; 简单是可靠的。 但是,如果您无法通过简单的方式来解决您的业务问题,请按照以下建议继续 ML 路线。

1. 将预测作为建议

一个很好的开始方式是承认并接受预测的本质和不确定性。 与其将预测呈现为事实,不如将输出作为建议或替代方案。 例如,在使用 Google 地图导航时,您可以在几条建议路线之间进行选择,也可以按照自己的逻辑进行选择。 在 Netflix 上,您可以选择推荐的节目或浏览其他节目。 这似乎是不言而喻的,但我们常常对自己创建的算法过于自信。

网络异常,图片无法展示
|

这种范例的一个例子是聊天机器人。 他们通常使用暗示性语言,而不是确切地告诉您应该做什么。 聊天机器人应用程序还让与之交互的客户明确知道这是一个聊天机器人,并且可能会出错。

2. 批量预测

如果您的问题解决方案允许组合,降低风险的一种简单方法是批量预测,而不是立即发布预测。 在批量中,您可以确定用于进行预测的数据的分布情况,并在导致异常输出之前发现输入数据中的意外异常和错误。 此外,您还可以在实际使用它们之前检查异常值和奇怪行为的预测输出分布。

网络异常,图片无法展示
|

这种方式的一个实际例子是与商业智能相关的模型,例如:客户流失预测。用户并不期望这些预测会实时更新,因为客户端的状态不会变化得那么快。例如,每天更新这些内容将允许您检查数据中是否存在根本性的更改(如:schema 更改),这些更改可能会突然导致您的模型预测每个客户都会流失,并在业务人员中引起恐慌。

同时,批量预测分布也可以被轻松监控

3. 让人们参与其中

在获得所有可能场景的足够数据之前,当您在某个置信水平上的预测能力失败时,您可能希望有人参与该过程。

有人会在预测过程中引入一个额外的步骤,它会自动检查,例如,输入数据是否在已知域中,预测是否在已知范围内,或者预测能力是多少(如果可用)。如果没有通过,自动过程将不会更进一步,并且由人接管。

网络异常,图片无法展示
|

这种方式对于财务和健康预测等高影响场景至关重要,在这些场景中,向最终用户提供不正确的预测可能会导致巨大的压力或更糟。 例如,如果您在一家汽车保险公司工作,该公司每天要处理数百个车窗破裂索赔,那么执行自动欺诈检测可能是合理的。 尽管如此,当您的模型不确定时,在人工操作员查看索赔之前让索赔人免于恐慌应该是一个明显的选择。

结论

随着机器学习在以人为中心的领域中得到更多采用,我们需要记住,人类的一个错误可能会被算法重复数百万次。 我们都知道,我们需要格外小心应用程序对人类生活产生的影响,例如:谁获得贷款,谁获得什么癌症治疗。


相关文章
|
7月前
|
机器学习/深度学习 监控
大模型开发:你如何在保持模型性能的同时减少过拟合的风险?
为应对大模型过拟合,采用正则化(L1/L2/Dropout)、早期停止训练以监控验证集性能,通过数据增强提升模型泛化能力,选择适合问题复杂度的模型,使用集成方法(如Bagging/Boosting)增强稳定性,以及利用预训练模型进行迁移学习。这些策略结合使用能有效降低过拟合风险,提高模型泛化性能。
318 2
|
存储 编解码 缓存
视频平台技术成本控制的量化方法
在线视频平台为用户提供服务时,面临的一个严重的挑战是,如何保证在为用户提供流畅 且稳定播放服务的前提下,尽量降低整体运营成本。本篇文章将围绕上述问题,重点讨论技术实践中的成本控制手段。
视频平台技术成本控制的量化方法
|
4月前
|
运维 监控 Devops
运维自动化:提升效率与减少人为错误的策略
【8月更文挑战第12天】在信息技术的海洋中,运维自动化如同一艘装备精良的航船,引领企业驶向高效、精准的彼岸。本文将深入探讨运维自动化的重要性,分析其如何通过智能化工具和策略,实现流程优化、效率提升及错误率降低。我们将一同见证,当创新技术与运维实践相结合时,是如何为企业带来革命性变革的。
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
PVG:用小模型验证大模型输出,解决“黑盒”难题
【8月更文挑战第4天】随AI技术的发展,机器学习系统广泛应用,但在高风险领域如医疗和金融中,其决策需可验证与解释。为此,提出了“Prover-Verifier Games”(PVG)框架,通过两个学习者——证明者与验证者的博弈,前者提供决策及证据,后者评估证据真伪并做决策,以此提升决策透明度。实验显示,在图像分类和自然语言推理任务中,验证者能有效区分真假证据,即便证明者提供虚假信息。不过,PVG也面临计算成本高和适用范围有限等问题。
85 1
|
5月前
|
运维 持续交付
运维自动化:提升效率与减少人为错误的关键策略
本文深入探讨了运维自动化在现代IT管理中的核心角色,从技术演进的角度分析了自动化工具的发展,并结合具体案例和统计数据,展示了自动化如何显著提高运维效率与准确性。文章还对运维自动化实施过程中的挑战进行了讨论,并提出了相应的解决策略,以期为企业实现运维自动化提供实用的指导。
|
7月前
|
人工智能 监控 安全
大模型安全风险的具体表现
【1月更文挑战第23天】大模型安全风险的具体表现
319 3
大模型安全风险的具体表现
|
算法 计算机视觉
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
图像生成过程中遭「截胡」:稳定扩散的失败案例受四大因素影响
118 0
|
机器学习/深度学习 算法 测试技术
使用用测试时数据增强(TTA)提高预测结果(上)
使用用测试时数据增强(TTA)提高预测结果
535 0
|
机器学习/深度学习 算法框架/工具 异构计算
使用用测试时数据增强(TTA)提高预测结果(下)
使用用测试时数据增强(TTA)提高预测结果(下)
195 0