模型监控:定义、重要性和最佳实践(AI Multiple)

简介: 正如我们在文章(机器学习生命周期)中指出的那样,MLOps 系统的生命周期包括各种过程,尽管付出了所有努力和时间,但不能保证创建有效的 MLOps。 据麦肯锡称,只有 36% 的公司可以部署 MLOps。 如果模型部署过程成功,则可以开始 ML 过程生命周期中最长的周期,即模型监控。

正如我们在文章(机器学习生命周期)中指出的那样,MLOps 系统的生命周期包括各种过程,尽管付出了所有努力和时间,但不能保证创建有效的 MLOps。 据麦肯锡称,只有 36% 的公司可以部署 MLOps。 如果模型部署过程成功,则可以开始 ML 过程生命周期中最长的周期,即模型监控。

网络异常,图片无法展示
|


什么是模型监控?

网络异常,图片无法展示
|


模型监控是指对 ML 模型的性能进行控制和评估,以确定其是否有效运行。 当 ML 模型经历一些性能衰减时,应采取适当的维护措施来恢复性能。 您可以将这个过程想象为不时将您的汽车送去维修,并更换汽车的轮胎或机油以获得更好的性能。


为什么模型监控很重要?

许多公司根据 ML 应用程序做出战略决策。 但是,ML 模型的性能会随着时间的推移而下降。 这可能导致公司做出非最佳决策,最终导致业绩下降、利润或收入下降等。

为了防止这种破坏性影响,公司应将 ML 模型的性能阈值视为必须始终满足的 KPI。 因此,他们应该定期监控他们的机器学习模型。


ML 模型随时间退化的原因是什么?

更改输入数据是 ML 模型随时间退化的主要原因。输入数据可能会因以下原因而改变:

  • ML 预测的环境是不断变化的,因此 ML 模型应该适应新的环境。
  • 流水线中的业务数据可能会随时间而变化。

不断变化的环境

ML 算法根据模型建立时的数据预测未来或优化流程。因此,算法根据该时间间隔的参数值解决业务问题。然而,我们生活的环境在不断变化,参数值也在不断变化。因此,为了有效地解释数据,必须根据环境的变化更新模型。

让我们以聊天机器人为例。我们知道语言是不断变化的。这就是为什么与今天的英语相比,很难理解莎士比亚英语。我们使用的词语也在不断变化。我们十年前使用的一些词在今天可能被认为是粗鲁的描述。因此,十年前为最大限度地提高客户满意度而设计的聊天机器人如果不加以监控,可能会给客户带来不安全的时间。

更改业务数据

流水线中使用的业务数据可能会不时更改。这很常见,因为数据工程团队对输入数据的来源控制有限。其原因可能是由于业务动态变化或公司的新业务决策。此外,法规也可能是这种变化的原因。

让我们想象一家匈牙利公司从美国销售进口商品。今天,匈牙利使用匈牙利福林作为本国货币,这意味着福林相对于美元的波动会影响业务效率。然而,几年后,匈牙利可能会使用欧元作为其货币,与福林相比,欧元的波动幅度有所不同。因此,上游数据应相应的调整。


公司应该监控哪些变量用于确保健康的机器学习模型?

为了确保 ML 模型的有效工作,公司可以检查以下变量:

  • 真实值与预测值检查:将 ML 模型的预测与现实世界数据进行比较。这是确定模型的预测是否准确的最佳方法。如果两者之间存在较大差距,则意味着需要对 ML 模型进行系统更新。
  • 数据分布变化:如前所述,世界有时会像 Covid 大流行一样快速变化。这种情况导致数据分布发生巨大变化。数据分布的变化是更新 ML 模型的消息。因此,建议密切关注它。
  • 无错误数据:ML 模型需要高质量的数据来执行最佳分析。因此,重要的是要确定数据是否正确。因此,定期的数据清洗可以保证数据的质量。
  • 公平:如果 ML 模型歧视一个或多个种族、宗教或其他群体,则必须迅速对其进行检修。这是因为如果人工智能偏见被发现,可能会对公司的市场价值造成严重后果。
  • 运行指标:检查 CPU、内存、硬盘和网络 I/O 的使用情况很有用。如果他们接近满负荷,则需要对有效工作的 ML 模型进行维护。


相关文章
|
2天前
|
机器学习/深度学习 人工智能 编解码
Inf-DiT:清华联合智谱AI推出超高分辨率图像生成模型,生成的空间复杂度从 O(N^2) 降低到 O(N)
Inf-DiT 是清华大学与智谱AI联合推出的基于扩散模型的图像上采样方法,能够生成超高分辨率图像,突破传统扩散模型的内存限制,适用于多种实际应用场景。
36 21
Inf-DiT:清华联合智谱AI推出超高分辨率图像生成模型,生成的空间复杂度从 O(N^2) 降低到 O(N)
|
3天前
|
人工智能 Python
ImBD:复旦联合华南理工推出 AI 内容检测模型,快速辨别文本内容是否为 AI 生成
ImBD是一款由复旦大学、华南理工大学等机构联合推出的AI内容检测器,能够快速识别机器修订文本,适用于多种场景,显著提升检测性能。
26 8
ImBD:复旦联合华南理工推出 AI 内容检测模型,快速辨别文本内容是否为 AI 生成
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
48 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
18天前
|
人工智能
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
AniDoc 是一款基于视频扩散模型的 2D 动画上色 AI 模型,能够自动将草图序列转换为彩色动画。该模型通过对应匹配技术和背景增强策略,实现了色彩和风格的准确传递,适用于动画制作、游戏开发和数字艺术创作等多个领域。
85 16
AniDoc:蚂蚁集团开源 2D 动画上色 AI 模型,基于视频扩散模型自动将草图序列转换成彩色动画,保持动画的连贯性
|
1天前
|
人工智能 物联网
如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台
如何将Together AI上基于Qwen2-7B训练的模型部署到ModelScope平台
27 10
|
5天前
|
人工智能 关系型数据库 分布式数据库
PolarDB-PG AI最佳实践3 :PolarDB AI多模态相似性搜索最佳实践
本文介绍了如何利用PolarDB结合多模态大模型(如CLIP)实现数据库内的多模态数据分析和查询。通过POLAR_AI插件,可以直接在数据库中调用AI模型服务,无需移动数据或额外的工具,简化了多模态数据的处理流程。具体应用场景包括图像识别与分类、图像到文本检索和基于文本的图像检索。文章详细说明了技术实现、配置建议、实战步骤及多模态检索示例,展示了如何在PolarDB中创建模型、生成embedding并进行相似性检索
|
5天前
|
SQL 人工智能 关系型数据库
PolarDB-PG AI最佳实践 2 :PolarDB AI X EAS实现自定义库内模型推理最佳实践
PolarDB通过POLAR_AI插件支持使用SQL调用AI/ML模型,无需专业AI知识或额外部署环境。结合阿里云EAS在线模型服务,可轻松部署自定义模型,在SQL中实现如文本翻译等功能。
|
27天前
|
人工智能 安全 测试技术
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
EXAONE 3.5 是 LG AI 研究院推出的开源 AI 模型,擅长长文本处理,能够有效降低模型幻觉问题。该模型提供 24 亿、78 亿和 320 亿参数的三个版本,支持多步推理和检索增强生成技术,适用于多种应用场景。
78 9
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
|
29天前
|
机器学习/深度学习 人工智能
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
SNOOPI是一个创新的AI文本到图像生成框架,通过增强单步扩散模型的指导,显著提升模型性能和控制力。该框架包括PG-SB和NASA两种技术,分别用于增强训练稳定性和整合负面提示。SNOOPI在多个评估指标上超越基线模型,尤其在HPSv2得分达到31.08,成为单步扩散模型的新标杆。
68 10
SNOOPI:创新 AI 文本到图像生成框架,提升单步扩散模型的效率和性能
|
29天前
|
人工智能 搜索推荐 开发者
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问
Aurora是xAI为Grok AI助手推出的新图像生成模型,专注于生成高逼真度的图像,特别是在人物和风景图像方面。该模型支持文本到图像的生成,并能处理包括公共人物和版权形象在内的多种图像生成请求。Aurora的可用性因用户等级而异,免费用户每天能生成三张图像,而Premium用户则可享受无限制访问。
66 11
Aurora:xAI 为 Grok AI 推出新的图像生成模型,xAI Premium 用户可无限制访问