ML 模型监控最佳工具(下)

简介: 如果您迟早将模型部署到生产环境,那么您将开始寻找 ML 模型监控工具。当您的 ML 模型影响业务时,您只需要了解“事物是如何工作的”。当事物停止工作时,你真正感受到这一点的第一刻。如果没有设置模型监控,您可能不知道哪里出了问题以及从哪里开始寻找问题和解决方案。


6. Qualdo

网络异常,图片无法展示
|


Qualdo 是 Azure、Google 和 AWS 中的机器学习模型性能监控工具。 该工具具有一些不错的基本功能,可让您在整个生命周期中观察模型。

使用 Qualdo,您可以从生产 ML 输入/预测数据、日志和应用程序数据中获得洞察力,以观察和改进您的模型性能。 有模型部署和数据漂移和数据异常的自动监控,您可以看到质量指标和可视化。

它还提供了在 Tensorflow 中监控 ML 流水线性能的工具,并利用了 Tensorflow 的数据验证和模型评估功能。

此外,它还集成了许多人工智能、机器学习和通信工具,以改善您的工作流程并简化协作。

这是一个相当简单的工具,并没有提供许多高级功能。 因此,如果您正在寻找一个简单的 ML 模型监控性能解决方案,那它就是一个好的选择。


7. Fiddler

网络异常,图片无法展示
|


Fiddler 是一个模型监控工具,具有用户友好、清晰、简单的界面。它使您可以监控模型性能、解释和调试模型预测、通过整个数据和切片来分析模型行为、大规模部署机器学习模型以及管理机器学习模型和数据集。

以下是 Fiddler 的 ML 模型监控功能:

  • 性能监控 - 一种探索数据漂移并识别哪些数据在漂移、何时漂移以及如何漂移的可视化方式
  • 数据完整性 - 确保没有不正确的数据进入您的模型,并且不会对最终用户体验产生负面影响
  • 跟踪异常值 - Fiddler 在异常值检测选项卡中显示单变量和多变量异常值
  • 服务指标 - 让您基本了解生产环境中 ML 服务的运行状况
  • 警报 — Fiddler 允许您为项目中的一个模型或一组模型设置警报,以警告生产中的问题

总体而言,它是监控具有所有必要功能的机器学习模型的绝佳工具。


8. Amazon SageMaker Model Monitor

网络异常,图片无法展示
|


Amazon SageMaker 模型监控 是 Amazon SageMaker 的工具之一。它会自动检测生产中部署的模型的不准确预测并发出警报,以便您保持模型的准确性。

以下是 SageMaker 模型监控功能的摘要:

  • 可定制的数据收集和监控——您可以选择您想要监控和分析的数据,无需编写任何代码
  • 以统计规则的形式内置分析,以检测数据和模型质量的漂移
  • 您可以编写自定义规则并为每个规则指定阈值。然后可以使用这些规则来分析模型性能
  • 指标可视化,并在 SageMaker notebook 实例中运行临时分析
  • 模型预测——导入数据以计算模型性能
  • 调度监控作业
  • 该工具与 Amazon SageMaker Clarify 集成,因此您可以识别 ML 模型中的潜在偏差

当与其他机器学习工具一起使用时,SageMaker 模型监视器可让您完全控制您的实验。


9. Seldon Core

网络异常,图片无法展示
|


Seldon Core 是一个开源平台,用于在 Kubernetes 上部署机器学习模型。 它是一个 MLOps 框架,可让您打包、部署、监控和管理数以千计的生产机器学习模型。

它可以在任何云和本地运行,与框架无关,支持顶级 ML 库、工具包和语言。 此外,它将您的 ML 模型(例如,Tensorflow、Pytorch、H2o)或语言包装器(Python、Java)转换为生产 REST/GRPC 微服务。

基本上,Seldon Core 具有扩展大量 ML 模型所需的所有功能。 您可以期待高级指标、异常值检测器、金丝雀、由预测器、转换器、路由器或组合器组成的丰富推理图等功能。


10. Censius

Censius 是一个 AI 模型可观察性平台,可让您监控整个 ML 流水线、解释预测并主动修复问题以改善业务成果。

网络异常,图片无法展示
|


Censius 的主要特点:

  • 完全可配置的监视器,可检测漂移、数据质量问题和性能下降
  • 实时通知让您提前了解模型服务流水线中的问题
  • 可定制的仪表板,您可以在其中对模型训练和生产数据进行切片和切块,并观察任何业务 KPI
  • 当您继续在生产中使用不同的模型进行试验和迭代时,对 A/B 测试框架的原生支持
  • 通过表格、图像、文本数据的可解释性深入挖掘问题的根本原因

总结

既然您知道了如何评估 ML 模型监视工具以及现有的工具,那么最好的方法就是测试出您喜欢的工具!

相关文章
|
存储 人工智能 Prometheus
ML 模型监控最佳工具(上)
如果您迟早将模型部署到生产环境,那么您将开始寻找 ML 模型监控工具。 当您的 ML 模型影响业务时,您只需要了解“事物是如何工作的”。 当事物停止工作时,你真正感受到这一点的第一刻。如果没有设置模型监控,您可能不知道哪里出了问题以及从哪里开始寻找问题和解决方案。
|
6月前
|
监控 JavaScript 数据库
OpenLLMetry:完美支持 LLM 应用的开源监测工具
【2月更文挑战第16天】OpenLLMetry:完美支持 LLM 应用的开源监测工具
466 1
OpenLLMetry:完美支持 LLM 应用的开源监测工具
|
6月前
|
机器学习/深度学习 PyTorch TensorFlow
iOS设备功能和框架: 什么是 Core ML?如何在应用中集成机器学习模型?
iOS设备功能和框架: 什么是 Core ML?如何在应用中集成机器学习模型?
178 0
|
存储 人工智能 自然语言处理
使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具
Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。它提供一个框架将LLM与其他数据源(如互联网或个人文件)连接起来。这允许开发人员将多个命令链接在一起,以创建更复杂的应用程序。包括最近比较火爆的AutoGPT等都是使用了Langchain框架进行开发的。所以本文将介绍如何使用LangChain来创建我们自己的论文汇总工具。
919 0
使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具
|
机器学习/深度学习 数据采集 人工智能
LLM系列 | 02: Vicuna简介及模型部署实测
今天这篇小作文主要介绍Vicuna模型、基于官方模型13B模型部署服务及对话实测。
|
机器学习/深度学习 存储 Kubernetes
【ML】机器学习模型保存方式总结
【ML】机器学习模型保存方式总结
|
机器学习/深度学习 存储 人工智能
可视化机器学习实验指标和超参数的最佳工具(Neptune)
根据关键指标评估模型是了解模型质量的关键第一步。 跟踪超参数和相应的评估指标很重要,因为超参数的微小变化有时会对模型质量产生很大影响。 因此,了解哪些超参数有影响,哪些不影响评估指标可以带来有价值的见解。 这就是为什么您应该可视化这些参数对您的指标的影响,并了解您在所有 ML 实验中的模型性能如何。 为了帮助您,我收集了一份推荐工具列表,这些工具将为您完成繁琐的工作。 以下是可视化机器学习实验指标和超参数的六种工具。
|
人工智能 监控 API
MLOps:模型监控
使用模型度量堆栈进行模型监视,对于将已部署的ML模型的反馈回路放回模型构建阶段至关重要,这样ML模型可以在不同的场景下不断改进自己。
|
机器学习/深度学习 数据采集 传感器
机器学习模型监控清单
一旦在生产环境中部署了机器学习模型,就需要确保它的性能。在本文中,我们建议如何监视您的模型和要使用的开源工具。 建立机器学习模型并不容易。在生产环境中部署服务更加困难。但即使你成功地将所有流水线连接在一起,事情也不会就此停止。
|
机器学习/深度学习 数据采集 存储
机器学习模型监控(Aporia)(下)
机器学习模型监控 什么是机器学习 (ML) 模型监控? 机器学习监控是一组用于观察生产中的 ML 模型并确保其性能可靠性的技术。 ML模型通过观察数据集中的示例进行训练,并将代表模型在训练任务中表现的好坏的错误最小化。
下一篇
无影云桌面