浅述MLOps的价值

简介: 通过明确定义的获取数据的位置和类型来标准化元数据管理加快了解哪些输入和参数是有效的,哪些是无效的时间。极大地改善了数据科学团队成员之间的协作。

通过明确定义的获取数据的位置和类型来标准化元数据管理

  • 加快了解哪些输入和参数是有效的,哪些是无效的时间。
  • 极大地改善了数据科学团队成员之间的协作。
  • 这是实验跟踪和模型可重现性的第一步。

实现模型注册表(仓库)并将其链接到每个实验生成的其他参数

  • 现在您知道了每个模型的训练参数和指标。
  • 模型可以直接从模型注册表获取到服务(生产/staging)环境。
  • 可以在模型之间快速切换或同时提供多个版本

将元数据与生成它的源代码匹配

  • 现在您知道了用于生成元数据和训练模型的源代码(实验)。
  • 这是模型可重现性的另一个重要步骤。

对您的输入数据进行版本控制

  • 在未来的任何时间,您过去的实验几乎可以完全重现。对内部流程和外部审计师都很重要。
  • 这是 CD(持续交付)和 CT(持续培训)的关键第一步。

识别常见/可重复的操作(例如:数据预处理)并激励团队将它们迁移到可重用的组件中

  • 节省构建和执行(在实验阶段和 CI/CD 期间)常见操作的时间。
  • 在整个公司范围内标准化应如何执行可重复的步骤。
  • 这是基于 CD/CT 的流水线执行的一个非常重要的步骤。

标准化模型格式以进行部署

  • 经过训练的模型符合公司范围内定义的模型格式。
  • 更快地开发模型服务组件。
  • 这是 CD 和模型测试的另一个重要步骤。

在流水线中打包和标准化您的实验

  • 将您的实验过程转移到明确定义的流水线步骤(从数据读取、准备和模型训练结束)将能够开发可重用的组件,从而显着加快和标准化整个实验过程。

在实验阶段从训练模型切换到部署可以训练它的整个 (CD) 流水线

  • 任何环境的模型都可以在任何时间点使用新数据自动(或使用触发器)重新训练。
  • 模型“更新”不需要花费数据科学家的时间。

监控和日志

  • 确保预测正常运行的时间、延迟以及生产环境中的任何产品都应该提供的所有其他“好处”。
  • 记录并监控所有传入的分析请求(例如:模型漂移)和反馈。
  • 降低与基础设施相关的成本,例如:最小化 GPU 执行时间。

通过数据验证增强流水线(用于实验和 CD/CT 的流水线)

  • 自动发现输入数据中可能影响模型预测质量的数据 schema 更改和分布异常。
  • 通过仅在需要时为模型再训练提供反馈来降低成本。

通过模型分析和验证增强流水线

  • 将模型作为一个整体并跨多个数据片段(例如:人口统计)自动评估,以确保预测的整体质量。
  • 在其带来的改进的基础上,将新模型推向生产。


相关文章
|
5月前
|
人工智能 供应链 测试技术
CIO们在运营、创新、IT和业务的关系及如何利用GenAI方面的九大经验教训
CIO们在运营、创新、IT和业务的关系及如何利用GenAI方面的九大经验教训
|
5月前
|
数据采集 机器学习/深度学习 人工智能
CIO 们的九大关键经验:在运营、创新、IT 与业务融合及 GenAI 运用中,等待你揭开的神秘面纱是什么?
【8月更文挑战第19天】作为企业数字化转型的技术观察者,总结CIO们在运营、创新、IT业务融合与GenAI应用中的九大经验:一是优化流程提升效率;二是创新需紧贴业务战略;三是技术须响应业务需求;四是GenAI应用要场景化;五是保障数据质量与安全;六是重视人才培养;七是寻求外部专业合作;八是合理规划预算;九是持续评估改进。这些洞见为企业数字化转型提供了重要参考。
57 0
|
8月前
|
开发者
拥抱不确定性:在软件开发中实践敏捷思维
【4月更文挑战第27天】 在不断变化的技术领域,不确定性是一种常态。本文探讨了如何在软件开发过程中采用敏捷思维来应对和利用这种不确定性。通过分析敏捷方法论的核心原则,我们将了解如何通过迭代开发、持续反馈和适应性规划来增强项目的灵活性和响应性。文章将提供实用的策略和实例,帮助读者在技术项目中实施敏捷思维,从而更有效地管理复杂性和变化。
62 2
|
8月前
|
开发者 UED
拥抱不确定性:软件开发中的敏捷思维与持续学习
【5月更文挑战第29天】 在快速变化的技术世界中,不确定性已成为常态。本文探讨了如何在软件开发实践中运用敏捷思维来适应和利用这种不确定性,以及如何通过持续学习保持个人和团队的竞争力。通过分析敏捷方法论的核心原则,我们揭示了它们如何帮助开发者更好地应对需求变更、技术演进和市场动态。同时,文章还将讨论持续学习的重要性,以及如何通过实践驱动的学习来不断提升技能和知识,从而在不断变化的环境中保持领先地位。
|
8月前
|
敏捷开发 安全 测试技术
拥抱不确定性:软件开发中的敏捷思维与实践
【4月更文挑战第17天】 在快速变化的技术世界中,不确定性已成为常态。本文探讨了如何在软件开发过程中应用敏捷思维来应对和利用这种不确定性。通过分析敏捷方法论的核心原则,我们揭示了它们如何帮助团队更灵活地响应变化,提高产品质量,并最终实现持续交付。文章还将分享一些实用的敏捷实践技巧,以及如何在团队中培养这种思维方式。
|
8月前
|
人工智能 自然语言处理 文字识别
飞天技术观丨大模型如何真正在应用环节产生价值
大模型揭开了智能时代的序幕,其技术发展日新月异,创新成果不断涌现。可即便如此,最终不可避免地要回答一个问题:大模型如何真正实现商业化应用落地?
飞天技术观丨大模型如何真正在应用环节产生价值
|
安全 架构师 数据管理
【企业架构框架】是什么让 TOGAF 10 成为有价值的贡献
【企业架构框架】是什么让 TOGAF 10 成为有价值的贡献
|
架构师 Oracle 搜索推荐
【企业架构】当今企业架构实践的相关性是什么?
【企业架构】当今企业架构实践的相关性是什么?
|
机器学习/深度学习 数据可视化
提高数据科学家讲故事能力的5个小技巧
提高数据科学家讲故事能力的5个小技巧
126 0
|
机器学习/深度学习 存储 设计模式
3月10日云栖精选夜读:论分布式应用对团队和谐的作用
精选优质文章,每日更新一期,欢迎大家品读!
2582 0