模型监控:定义、重要性和最佳实践(AI Multiple)

简介: 正如我们在文章(机器学习生命周期)中指出的那样,MLOps 系统的生命周期包括各种过程,尽管付出了所有努力和时间,但不能保证创建有效的 MLOps。 据麦肯锡称,只有 36% 的公司可以部署 MLOps。 如果模型部署过程成功,则可以开始 ML 过程生命周期中最长的周期,即模型监控。

正如我们在文章(机器学习生命周期)中指出的那样,MLOps 系统的生命周期包括各种过程,尽管付出了所有努力和时间,但不能保证创建有效的 MLOps。 据麦肯锡称,只有 36% 的公司可以部署 MLOps。 如果模型部署过程成功,则可以开始 ML 过程生命周期中最长的周期,即模型监控。

网络异常,图片无法展示
|


什么是模型监控?

网络异常,图片无法展示
|


模型监控是指对 ML 模型的性能进行控制和评估,以确定其是否有效运行。 当 ML 模型经历一些性能衰减时,应采取适当的维护措施来恢复性能。 您可以将这个过程想象为不时将您的汽车送去维修,并更换汽车的轮胎或机油以获得更好的性能。


为什么模型监控很重要?

许多公司根据 ML 应用程序做出战略决策。 但是,ML 模型的性能会随着时间的推移而下降。 这可能导致公司做出非最佳决策,最终导致业绩下降、利润或收入下降等。

为了防止这种破坏性影响,公司应将 ML 模型的性能阈值视为必须始终满足的 KPI。 因此,他们应该定期监控他们的机器学习模型。


ML 模型随时间退化的原因是什么?

更改输入数据是 ML 模型随时间退化的主要原因。输入数据可能会因以下原因而改变:

  • ML 预测的环境是不断变化的,因此 ML 模型应该适应新的环境。
  • 流水线中的业务数据可能会随时间而变化。

不断变化的环境

ML 算法根据模型建立时的数据预测未来或优化流程。因此,算法根据该时间间隔的参数值解决业务问题。然而,我们生活的环境在不断变化,参数值也在不断变化。因此,为了有效地解释数据,必须根据环境的变化更新模型。

让我们以聊天机器人为例。我们知道语言是不断变化的。这就是为什么与今天的英语相比,很难理解莎士比亚英语。我们使用的词语也在不断变化。我们十年前使用的一些词在今天可能被认为是粗鲁的描述。因此,十年前为最大限度地提高客户满意度而设计的聊天机器人如果不加以监控,可能会给客户带来不安全的时间。

更改业务数据

流水线中使用的业务数据可能会不时更改。这很常见,因为数据工程团队对输入数据的来源控制有限。其原因可能是由于业务动态变化或公司的新业务决策。此外,法规也可能是这种变化的原因。

让我们想象一家匈牙利公司从美国销售进口商品。今天,匈牙利使用匈牙利福林作为本国货币,这意味着福林相对于美元的波动会影响业务效率。然而,几年后,匈牙利可能会使用欧元作为其货币,与福林相比,欧元的波动幅度有所不同。因此,上游数据应相应的调整。


公司应该监控哪些变量用于确保健康的机器学习模型?

为了确保 ML 模型的有效工作,公司可以检查以下变量:

  • 真实值与预测值检查:将 ML 模型的预测与现实世界数据进行比较。这是确定模型的预测是否准确的最佳方法。如果两者之间存在较大差距,则意味着需要对 ML 模型进行系统更新。
  • 数据分布变化:如前所述,世界有时会像 Covid 大流行一样快速变化。这种情况导致数据分布发生巨大变化。数据分布的变化是更新 ML 模型的消息。因此,建议密切关注它。
  • 无错误数据:ML 模型需要高质量的数据来执行最佳分析。因此,重要的是要确定数据是否正确。因此,定期的数据清洗可以保证数据的质量。
  • 公平:如果 ML 模型歧视一个或多个种族、宗教或其他群体,则必须迅速对其进行检修。这是因为如果人工智能偏见被发现,可能会对公司的市场价值造成严重后果。
  • 运行指标:检查 CPU、内存、硬盘和网络 I/O 的使用情况很有用。如果他们接近满负荷,则需要对有效工作的 ML 模型进行维护。


相关文章
|
1月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
|
1月前
|
SQL 人工智能 关系型数据库
AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践
AI Agent的规划能力需权衡自主与人工。阿里云RDS AI助手实践表明:开放场景可由大模型自主规划,高频垂直场景则宜采用人工SOP驱动,结合案例库与混合架构,实现稳定、可解释的企业级应用,推动AI从“能聊”走向“能用”。
805 39
AI Agent的未来之争:任务规划,该由人主导还是AI自主?——阿里云RDS AI助手的最佳实践
|
2月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
673 109
|
1月前
|
人工智能 自然语言处理 前端开发
最佳实践2:用通义灵码以自然语言交互实现 AI 高考志愿填报系统
本项目旨在通过自然语言交互,结合通义千问AI模型,构建一个智能高考志愿填报系统。利用Vue3与Python,实现信息采集、AI推荐、专业详情展示及数据存储功能,支持响应式设计与Supabase数据库集成,助力考生精准择校选专业。(239字)
213 12
|
2月前
|
机器学习/深度学习 数据采集 人工智能
PyTorch学习实战:AI从数学基础到模型优化全流程精解
本文系统讲解人工智能、机器学习与深度学习的层级关系,涵盖PyTorch环境配置、张量操作、数据预处理、神经网络基础及模型训练全流程,结合数学原理与代码实践,深入浅出地介绍激活函数、反向传播等核心概念,助力快速入门深度学习。
193 1
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1418 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
1月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
263 120
|
2月前
|
人工智能 JSON 前端开发
Agentic AI崛起:九大核心技术定义未来人机交互模式​
本文系统梳理AI智能体架构设计的九大核心技术,涵盖智能体基础、多智能体协作、知识增强、模型优化、工具调用、协议标准化及人机交互等关键领域,助力构建高效、智能、协同的AI应用体系。建议点赞收藏,持续关注AI架构前沿技术。
893 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
567 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

热门文章

最新文章