ML:MLOps系列讲解之《基于ML的软件的三个层次》解读
导读:您将了解基于ML的软件的三个核心元素——数据、ML模型和代码。特别地,我们会将讨论:
(1)、数据工程管道
(2)、ML管道和ML工作流。
(3)、模型服务模式和部署策略
ML/AI迅速被新的应用程序和行业采用。如前所述,机器学习项目的目标是利用收集到的数据并应用机器学习算法来建立一个统计模型。然而,构建成功的基于ML的软件项目仍然很困难,因为每个基于ML的软件都需要管理三个主要资产:数据、模型和代码。机器学习模型操作化管理—MLOps,作为DevOps的扩展,围绕设计、构建和部署机器学习模型到生产中建立有效的实践和流程。我们在这里描述了在基于机器学习的软件开发中所涉及的基本技术方法,即数据工程、ML模型工程和软件发布工程。
目录
4.1、Data: Data Engineering Pipelines
4.1.2、Exploration and Validation
4.2、Model: Machine Learning Pipelines
4.2.5、Different forms of ML workflows不同形式的机器学习工作流程
4.2.6、ML Model serialization formats 机器学习模型序列化格式
4.3、Code: Deployment Pipelines
4.3.1、Model Serving Patterns模型服务模式
4.3.2、Deployment Strategies部署策略
相关文章
ML:MLOps系列讲解之《基于ML的软件的三个层次之01 Data: Data Engineering Pipelines》解读
ML:MLOps系列讲解之《基于ML的软件的三个层次之02 Model: Machine Learning Pipelines 2.1~2.4》解读
ML:MLOps系列讲解之《基于ML的软件的三个层次之03 Code: Deployment Pipelines》解读
4、《基于ML的软件的三个层次》解读
4.1、Data: Data Engineering Pipelines
4.1.1、Data Ingestion
4.1.2、Exploration and Validation
4.1.3、Data Splitting
4.2、Model: Machine Learning Pipelines
4.2.1、Model Training
4.2.2、Model Evaluation
4.2.3、Model Testing
4.2.4、Model Packaging
4.2.5、Different forms of ML workflows不同形式的机器学习工作流程
4.2.5.3、Model Serving Patterns—两个维度得到四种 ML架构模式
4.2.5.3.3、架构模式之Online Learning
4.2.6、ML Model serialization formats 机器学习模型序列化格式
4.2.6.1、Language-agnostic exchange formats语言无关交换格式
4.2.6.1.3、PFA(Portable Format for Analytics,便携式分析格式)旨在替代 PMML
4.2.6.1.4、ONNX(Open Neural Network eXchange,开放神经网络交换)是一种独立于 ML 框架的文件格式
4.2.6.2、Vendor-specific exchange formats供应商特定的交换格式
4.3、Code: Deployment Pipelines
4.3.1、Model Serving Patterns模型服务模式
4.3.1.2、Model-as-Dependency模型即依赖
4.3.1.3、Precompute Serving Pattern 预计算服务模式
4.3.1.5、Hybrid-Serving混合服务(联邦学习)
4.3.2、Deployment Strategies部署策略
4.3.2.1、Deploying ML Models as Docker Containers将ML模型部署为Docker容器
4.3.2.2、Deploying ML Models as Serverless Functions将ML模型部署为无服务器函数