模型监控:定义、重要性和最佳实践(AI Multiple)

简介: 正如我们在文章(机器学习生命周期)中指出的那样,MLOps 系统的生命周期包括各种过程,尽管付出了所有努力和时间,但不能保证创建有效的 MLOps。 据麦肯锡称,只有 36% 的公司可以部署 MLOps。 如果模型部署过程成功,则可以开始 ML 过程生命周期中最长的周期,即模型监控。

正如我们在文章(机器学习生命周期)中指出的那样,MLOps 系统的生命周期包括各种过程,尽管付出了所有努力和时间,但不能保证创建有效的 MLOps。 据麦肯锡称,只有 36% 的公司可以部署 MLOps。 如果模型部署过程成功,则可以开始 ML 过程生命周期中最长的周期,即模型监控。

网络异常,图片无法展示
|


什么是模型监控?

网络异常,图片无法展示
|


模型监控是指对 ML 模型的性能进行控制和评估,以确定其是否有效运行。 当 ML 模型经历一些性能衰减时,应采取适当的维护措施来恢复性能。 您可以将这个过程想象为不时将您的汽车送去维修,并更换汽车的轮胎或机油以获得更好的性能。


为什么模型监控很重要?

许多公司根据 ML 应用程序做出战略决策。 但是,ML 模型的性能会随着时间的推移而下降。 这可能导致公司做出非最佳决策,最终导致业绩下降、利润或收入下降等。

为了防止这种破坏性影响,公司应将 ML 模型的性能阈值视为必须始终满足的 KPI。 因此,他们应该定期监控他们的机器学习模型。


ML 模型随时间退化的原因是什么?

更改输入数据是 ML 模型随时间退化的主要原因。输入数据可能会因以下原因而改变:

  • ML 预测的环境是不断变化的,因此 ML 模型应该适应新的环境。
  • 流水线中的业务数据可能会随时间而变化。

不断变化的环境

ML 算法根据模型建立时的数据预测未来或优化流程。因此,算法根据该时间间隔的参数值解决业务问题。然而,我们生活的环境在不断变化,参数值也在不断变化。因此,为了有效地解释数据,必须根据环境的变化更新模型。

让我们以聊天机器人为例。我们知道语言是不断变化的。这就是为什么与今天的英语相比,很难理解莎士比亚英语。我们使用的词语也在不断变化。我们十年前使用的一些词在今天可能被认为是粗鲁的描述。因此,十年前为最大限度地提高客户满意度而设计的聊天机器人如果不加以监控,可能会给客户带来不安全的时间。

更改业务数据

流水线中使用的业务数据可能会不时更改。这很常见,因为数据工程团队对输入数据的来源控制有限。其原因可能是由于业务动态变化或公司的新业务决策。此外,法规也可能是这种变化的原因。

让我们想象一家匈牙利公司从美国销售进口商品。今天,匈牙利使用匈牙利福林作为本国货币,这意味着福林相对于美元的波动会影响业务效率。然而,几年后,匈牙利可能会使用欧元作为其货币,与福林相比,欧元的波动幅度有所不同。因此,上游数据应相应的调整。


公司应该监控哪些变量用于确保健康的机器学习模型?

为了确保 ML 模型的有效工作,公司可以检查以下变量:

  • 真实值与预测值检查:将 ML 模型的预测与现实世界数据进行比较。这是确定模型的预测是否准确的最佳方法。如果两者之间存在较大差距,则意味着需要对 ML 模型进行系统更新。
  • 数据分布变化:如前所述,世界有时会像 Covid 大流行一样快速变化。这种情况导致数据分布发生巨大变化。数据分布的变化是更新 ML 模型的消息。因此,建议密切关注它。
  • 无错误数据:ML 模型需要高质量的数据来执行最佳分析。因此,重要的是要确定数据是否正确。因此,定期的数据清洗可以保证数据的质量。
  • 公平:如果 ML 模型歧视一个或多个种族、宗教或其他群体,则必须迅速对其进行检修。这是因为如果人工智能偏见被发现,可能会对公司的市场价值造成严重后果。
  • 运行指标:检查 CPU、内存、硬盘和网络 I/O 的使用情况很有用。如果他们接近满负荷,则需要对有效工作的 ML 模型进行维护。


相关文章
|
27天前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
20天前
|
机器学习/深度学习 人工智能 UED
OpenAI o1模型:AI通用复杂推理的新篇章
OpenAI发布了其最新的AI模型——o1,这款模型以其独特的复杂推理能力和全新的训练方式,引起了业界的广泛关注。今天,我们就来深入剖析o1模型的特点、背后的原理,以及一些有趣的八卦信息。
221 73
|
16天前
|
存储 人工智能 算法
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
阿里云AI基础设施升级亮相,模型算力利用率提升超20%
112 18
|
23天前
|
人工智能 自动驾驶 云计算
【通义】AI视界|谷歌大模型被盯上!欧盟最高隐私监管机构对PaLM2模型展开调查~
本文汇总了近24小时内科技领域的五大要闻:欧盟对谷歌PaLM2模型启动隐私合规调查;甲骨文推出Zettascale云计算集群,集成大量NVIDIA GPU强化计算力;红杉资本偏好AI应用投资而非模型构建;夸克新推智能助手CueMe,支持长达2万字内容生成;沃尔沃与NVIDIA合作,未来车型将采用后者先进芯片提升自动驾驶功能。以上内容由通义自动生成。
|
25天前
|
机器学习/深度学习 人工智能 供应链
【通义】AI视界|OpenAI的“草莓”模型预计两周内上线!像人类一样思考!
本文介绍了近期科技领域的五大亮点:OpenAI即将推出的新一代AI模型“草莓”,具备高级推理能力;亚马逊测试AI技术加速有声读物生产,通过语音克隆提高效率;Kimi API新增联网搜索功能,拓宽信息来源;顺丰发布物流行业专用大语言模型“丰语”,提升工作效率;钉钉推出“AI班级群”功能,改善家校沟通体验。更多详情,请访问[通义官网]。
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
AI战略丨物流 AI 新变化,用大模型定义
物流企业在大模型上纷纷主动探索,也在推动物流行业实现智能化加速。
|
29天前
|
人工智能 自然语言处理 数据挖掘
【通义】AI视界|性能超越GPT-4o?最强大的开源AI模型来了……
本文介绍了五项最新AI技术动态,包括性能超越GPT-4o的开源AI模型Reflection70B、智谱清言App限时免费的视频通话功能、哈佛医学院研发的癌症诊断AI模型CHIEF、Replit推出的AI编程助手,以及英特尔与日本AIST合作设立的芯片制造研发中心。这些进展展示了AI领域的快速创新与广泛应用。更多详情,请访问通义官网体验。
|
28天前
|
人工智能 测试技术 PyTorch
AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估
本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。
|
9天前
|
人工智能 自然语言处理 Linux
Llama 3.2:开源可定制视觉模型,引领边缘AI革命
Llama 3.2 系列 11B 和 90B 视觉LLM,支持图像理解,例如文档级理解(包括图表和图形)、图像字幕以及视觉基础任务(例如基于自然语言描述在图像中精确定位对象)。
|
1月前
|
机器学习/深度学习 人工智能
AI模型提早5年预警乳腺癌,MIT研究登Science获LeCun转发
【9月更文挑战第1天】麻省理工学院(MIT)研究人员开发的深度学习AI模型,在乳腺癌早期预警方面取得突破性进展,相比传统方法提前5年预警癌症,准确率超过90%。此成果不仅在医学界引起轰动,还获得了人工智能领域知名学者Yann LeCun的高度评价。尽管面临准确性和可解释性的挑战,但该研究展示了AI在医疗领域的巨大潜力,有望革新乳腺癌的早期筛查和诊断方式。论文详情见[链接]。
31 3

热门文章

最新文章

下一篇
无影云桌面