降低模型输出风险的三种方法(Valohai)

简介: 地球上的每一项业务和行为都包含风险,包括机器学习,或者更广泛地说人工智能也是如此。但是,出于多种原因,您公司的传统风险管理通常不会处理 AI 风险。首先,算法通常基于专有数据,模型和技术是在特定(业务)问题的领域范围内开发的。其次,算法可能是复杂的、不可预测的并且难以解释。最后,ML 场景相对较新,因此我们也缺乏最佳实践,同时,监管滞后。

我们需要通过解决我们如何开发这些算法以及我们如何在现实世界中应用这些算法来最小化风险

在本文中,我将重点介绍后一部分。换句话说,我将看看模型输出以及它们是如何使用的,因为有很多关于以数据为中心的 AI 以及如何确保你的模型是可解释的文献。不幸的是,预测的应用并不总是像应有的那样接近数据科学家。

网络异常,图片无法展示
|

您应该如何降低输出风险? 第一步是考虑是否需要机器学习。 与 ML 解决方案相比,由人工编写的业务规则风险更小,更易于解释。 如果这不可能,请考虑最不复杂的数据科学解决方案,例如:传统的、可解释(简单)的逻辑回归。

简单是好的; 简单是可靠的。 但是,如果您无法通过简单的方式来解决您的业务问题,请按照以下建议继续 ML 路线。

1. 将预测作为建议

一个很好的开始方式是承认并接受预测的本质和不确定性。 与其将预测呈现为事实,不如将输出作为建议或替代方案。 例如,在使用 Google 地图导航时,您可以在几条建议路线之间进行选择,也可以按照自己的逻辑进行选择。 在 Netflix 上,您可以选择推荐的节目或浏览其他节目。 这似乎是不言而喻的,但我们常常对自己创建的算法过于自信。

网络异常,图片无法展示
|

这种范例的一个例子是聊天机器人。 他们通常使用暗示性语言,而不是确切地告诉您应该做什么。 聊天机器人应用程序还让与之交互的客户明确知道这是一个聊天机器人,并且可能会出错。

2. 批量预测

如果您的问题解决方案允许组合,降低风险的一种简单方法是批量预测,而不是立即发布预测。 在批量中,您可以确定用于进行预测的数据的分布情况,并在导致异常输出之前发现输入数据中的意外异常和错误。 此外,您还可以在实际使用它们之前检查异常值和奇怪行为的预测输出分布。

网络异常,图片无法展示
|

这种方式的一个实际例子是与商业智能相关的模型,例如:客户流失预测。用户并不期望这些预测会实时更新,因为客户端的状态不会变化得那么快。例如,每天更新这些内容将允许您检查数据中是否存在根本性的更改(如:schema 更改),这些更改可能会突然导致您的模型预测每个客户都会流失,并在业务人员中引起恐慌。

同时,批量预测分布也可以被轻松监控

3. 让人们参与其中

在获得所有可能场景的足够数据之前,当您在某个置信水平上的预测能力失败时,您可能希望有人参与该过程。

有人会在预测过程中引入一个额外的步骤,它会自动检查,例如,输入数据是否在已知域中,预测是否在已知范围内,或者预测能力是多少(如果可用)。如果没有通过,自动过程将不会更进一步,并且由人接管。

网络异常,图片无法展示
|

这种方式对于财务和健康预测等高影响场景至关重要,在这些场景中,向最终用户提供不正确的预测可能会导致巨大的压力或更糟。 例如,如果您在一家汽车保险公司工作,该公司每天要处理数百个车窗破裂索赔,那么执行自动欺诈检测可能是合理的。 尽管如此,当您的模型不确定时,在人工操作员查看索赔之前让索赔人免于恐慌应该是一个明显的选择。

结论

随着机器学习在以人为中心的领域中得到更多采用,我们需要记住,人类的一个错误可能会被算法重复数百万次。 我们都知道,我们需要格外小心应用程序对人类生活产生的影响,例如:谁获得贷款,谁获得什么癌症治疗。


相关文章
|
缓存 NoSQL 应用服务中间件
万字攻略,社招腾讯天美C++后台面经,面试题整理(上)
万字攻略,社招腾讯天美C++后台面经,面试题整理
|
域名解析 Cloud Native Java
重磅官宣:Nacos2.0 发布,性能提升 10 倍
继 Nacos 1.0 发布以来,Nacos 迅速被成千上万家企业采用,并构建起强大的生态。但是随着用户深入使用,逐渐暴露一些性能问题,因此我们启动了 Nacos 2.0 的隔代产品设计,时隔半年我们终于将其全部实现,实测性能提升 10 倍,相信能满足所有用户的性能需求。下面由我代表社区为大家介绍一下这款跨代产品。
重磅官宣:Nacos2.0 发布,性能提升 10 倍
|
5月前
|
IDE 搜索推荐 程序员
《CodeBuddy:像哆啦A梦一样智能的编程助手》
本文介绍腾讯云代码助手CodeBuddy——智能编程伙伴,宛如哆啦A梦般的存在。它具备智能辅助、个性化学习、多场景适配等优势,支持主流IDE与多种编程语言,保护代码隐私并开源透明。通过上下文理解、实时错误检测等功能提升开发效率;根据编码风格优化建议,构建知识图谱。下载链接提供,安装后即可在IDE中使用,助你成为更高效的开发者。
498 17
《CodeBuddy:像哆啦A梦一样智能的编程助手》
|
6月前
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
1939 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
|
7月前
|
机器学习/深度学习 人工智能 安全
AI大模型安全风险和应对方案
AI大模型面临核心安全问题,包括模型内在风险(如欺骗性对齐、不可解释性和模型幻觉)、外部攻击面扩大(如API漏洞、数据泄露和对抗性攻击)及生成内容滥用(如深度伪造和虚假信息)。应对方案涵盖技术防御与优化、全生命周期管理、治理与行业协同及用户教育。未来需关注动态风险适应、跨领域协同和量子安全预研,构建“技术+管理+法律”三位一体的防护体系,推动AI安全发展。
2361 1
|
JSON JavaScript 数据可视化
开发 CNode 技术社区智能体
CNode 社区是国内最大的 Node.js 开源技术社区,致力于 Node.js 技术研究。本文基于 Botnow 平台,通过创建 Bot、插件及工作流,详细介绍了如何利用 CNode 社区的开放 API 构建智能体,并最终发布上线,实现智能化交互功能。
|
8月前
|
存储 供应链 物联网
区块链技术的未来发展趋势:革新、挑战与机遇
区块链技术的未来发展趋势:革新、挑战与机遇
371 8
|
11月前
|
Kubernetes Cloud Native API
云原生架构下微服务治理的深度探索与实践####
本文旨在深入剖析云原生环境下微服务治理的核心要素与最佳实践,通过实际案例分析,揭示高效、稳定的微服务架构设计原则及实施策略。在快速迭代的云计算领域,微服务架构以其高度解耦、灵活扩展的特性成为众多企业的首选。然而,伴随而来的服务间通信、故障隔离、配置管理等挑战亦不容忽视。本研究聚焦于云原生技术栈如何赋能微服务治理,涵盖容器编排(如Kubernetes)、服务网格(如Istio/Envoy)、API网关、分布式追踪系统等关键技术组件的应用与优化,为读者提供一套系统性的解决方案框架,助力企业在云端构建更加健壮、可维护的服务生态。 ####
|
人工智能 算法
直接使用大模型面临的问题
【1月更文挑战第20天】直接使用大模型面临的问题
881 4
直接使用大模型面临的问题
|
12月前
|
前端开发 JavaScript 数据库连接
一、Flask入门介绍
一、Flask入门介绍
365 1