【mlflow系列1】mlflow 的搭建使用

简介: 【mlflow系列1】mlflow 的搭建使用

背景


mlflow是Databrick开源的机器学习管理平台,它很好的解藕了算法训练和算法模型服务,使得算法工程师专注于模型的训练,而不需要过多的关注于服务的,

而且在我们公司已经有十多个服务稳定运行了两年多。


搭建


mlflow的搭建主要是mlflow tracking server的搭建,tracking server主要是用于模型的元数据以及模型的数据存储

我们这次以minio作为模型数据的存储后台,mysql作为模型元数据的存储,因为这种模式能满足线上的需求,不仅仅是用于测试


minio的搭建

参考我之前的文章MinIO的搭建使用,并且创建名为mlflow的bucket,便于后续操作


mlflow的搭建


conda的安装

参照install conda,根据自己的系统安装不同的conda环境

mlfow tracking server安装

# 创建conda环境 并安装 python 3.6  
conda create -n mlflow-1.11.0 python==3.6
#激活conda环境
conda activate mlflow-1.11.0
# 安装mlfow tracking server python需要的依赖包
pip install mlflow==1.11.0 
pip install mysqlclient
pip install boto3
  • mlflow tracking server的启动
暴露出minio url以及需要的ID和KEY,因为mlflow tracking server在上传模型文件时需要   
export AWS_ACCESS_KEY_ID=AKIAIOSFODNN7EXAMPLE
export AWS_SECRET_ACCESS_KEY=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY
export MLFLOW_S3_ENDPOINT_URL=http://localhost:9001
mlflow server \
   --backend-store-uri mysql://root:AO,h07ObIeH-@localhost/mlflow_test \
   --host 0.0.0.0 -p 5002 \
   --default-artifact-root s3://mlflow

访问localhost:5002, 就能看到如下界面:

image.png

使用

拷贝以下的wine.py文件

import os
import warnings
import sys
import pandas as pd
import numpy as np
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.model_selection import train_test_split
from sklearn.linear_model import ElasticNet
import mlflow.sklearn
def eval_metrics(actual, pred):
  rmse = np.sqrt(mean_squared_error(actual, pred))
  mae = mean_absolute_error(actual, pred)
  r2 = r2_score(actual, pred)
  return rmse, mae, r2
if __name__ == "__main__":
  warnings.filterwarnings("ignore")
  np.random.seed(40)
  # Read the wine-quality csv file (make sure you're running this from the root of MLflow!)
  wine_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), "wine-quality.csv")
  data = pd.read_csv(wine_path)
  # Split the data into training and test sets. (0.75, 0.25) split.
  train, test = train_test_split(data)
  # The predicted column is "quality" which is a scalar from [3, 9]
  train_x = train.drop(["quality"], axis=1)
  test_x = test.drop(["quality"], axis=1)
  train_y = train[["quality"]]
  test_y = test[["quality"]]
  alpha = float(sys.argv[1]) if len(sys.argv) > 1 else 0.5
  l1_ratio = float(sys.argv[2]) if len(sys.argv) > 2 else 0.5
  mlflow.set_tracking_uri("http://localhost:5002")
  client = mlflow.tracking.MlflowClient()
  mlflow.set_experiment('http_metrics_test')
  with mlflow.start_run():
      lr = ElasticNet(alpha=alpha, l1_ratio=l1_ratio, random_state=42)
      lr.fit(train_x, train_y)
      predicted_qualities = lr.predict(test_x)
      (rmse, mae, r2) = eval_metrics(test_y, predicted_qualities)
      print("Elasticnet model (alpha=%f, l1_ratio=%f):" % (alpha, l1_ratio))
      print("  RMSE: %s" % rmse)
      print("  MAE: %s" % mae)
      print("  R2: %s" % r2)
      mlflow.log_param("alpha", alpha)
      mlflow.log_param("l1_ratio", l1_ratio)
      mlflow.log_metric("rmse", rmse)
      mlflow.log_metric("r2", r2)
      mlflow.log_metric("mae", mae)
      mlflow.sklearn.log_model(lr, "model")

注意:

1.mlflow.set_tracking_uri("http://localhost:5002") 设置为刚才启动的mlflow tracking server的地址

2.mlflow.set_experiment('http_metrics_test') 设置实验的名字

3.安装该程序所依赖的python包

4.如果不是在同一个conda环境中,还得执行

    export AWS_ACCESS_KEY_ID=AKIAIOSFODNN7EXAMPLE      
    export AWS_SECRET_ACCESS_KEY=wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY     
    export MLFLOW_S3_ENDPOINT_URL=http://localhost:9001      

便于python客户端上传模型文件以及模型元数据

直接执行 python wine.py 如果成功,访问mlflow tracking server ui下有如下

image.png

点击 2020-10-30 10:34:38,如下:

image.png

image.png

启动mlflow 算法服务

在同一个conda环境中执行命令

export MLFLOW_TRACKING_URI=http://localhost:5002        
mlflow models serve -m runs:/e69aed0b22fb45debd115dfc09dbc75a/model -p 1234 --no-conda       

其中e69aed0b22fb45debd115dfc09dbc75a为mlflow tracking server ui中的run id


如遇到ModuleNotFoundError: No module named ‘sklearn’

执行 pip install scikit-learn==0.19.1

遇到ModuleNotFoundError: No module named ‘scipy’

执行pip install scipy


请求访问该model启动的服务:

curl -X POST -H "Content-Type:application/json; format=pandas-split" --data '{"columns":["alcohol", "chlorides", "citric acid", "density", "fixed acidity", "free sulfur dioxide", "pH", "residual sugar", "sulphates", "total sulfur dioxide", "volatile acidity"],"data":[[12.8, 0.029, 0.48, 0.98, 6.2, 29, 3.33, 1.2, 0.39, 75, 0.66]]}' http://127.0.0.1:1234/invocations

输出 [5.455573233630147] 则表明该模型服务成功部署

至此主要简单的mlflow使用就完成了,如果还有mlflow不支持的算法,可以参照自定义model

相关文章
|
机器学习/深度学习 存储 弹性计算
使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践| 学习笔记(一)
快速学习使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践
1218 0
使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践| 学习笔记(一)
|
存储 安全 对象存储
手把手教你搭建阿里云图床(PicGo+Typora+阿里云OSS),新手小白一看就会
本文详细介绍了怎样帮助新手小白从注册,购买阿里云OSS,到一步一步配置OSS做为图床,和PicGo、Typora软件连接,配置好关联之后,在使用Typora写文章时,如果需要插入图片,只需要将图片复制粘贴到Typora的编辑区域,就会自动通过PicGo上传到指定图床,自动复制外网能访问的URL并展示,简直不要太方便,极大的解决了编辑文章时复制处理图片链接的痛点。
9595 15
手把手教你搭建阿里云图床(PicGo+Typora+阿里云OSS),新手小白一看就会
|
JSON API 持续交付
逐步指南:使用FastAPI部署YOLO模型的步骤
逐步指南:使用FastAPI部署YOLO模型的步骤
|
Kubernetes TensorFlow 算法框架/工具
Kubeflow 使用指南
Kubeflow(https://github.com/kubeflow)是基于Kubernetes(https://kubernets.io,容器编排与管理服务软件)和TensorFlow(https://tensorflow.org,深度学习库)的机器学习流程工具,使用Ksonnet进行应用包的管理。
13346 0
|
6月前
|
存储 人工智能 关系型数据库
《大佬都在用!MLflow、DVC助力MySQL与AI模型完美融合》
在AI与数据管理深度融合的背景下,确保模型的可追溯性、可重复性及高效管理至关重要。MySQL作为关系型数据库,与MLflow和DVC等工具集成,为解决这些挑战提供了有效途径。这种集成通过实验跟踪、模型注册与部署、数据版本控制等功能,提升了AI项目的开发效率与生产环境中的稳定性。 MLflow负责实验记录、模型注册与部署,结合MySQL实现持久化存储;DVC专注于数据版本控制,确保实验可重复性与团队协作效率。然而,集成过程中也面临数据一致性、性能扩展及安全权限管理等挑战,需通过优化流程和技术手段应对。
238 22
|
10月前
|
机器学习/深度学习 人工智能 自然语言处理
ModernBERT:英伟达开源的新一代编码器模型,性能超越 SOTA,通过去除填充和序列打包减少计算浪费,提高训练和推理的效率
ModernBERT 是由英伟达和 HuggingFace 等机构联合开源的新一代编码器模型,支持长上下文处理,性能超越 SOTA,适合多种自然语言处理任务。
348 7
ModernBERT:英伟达开源的新一代编码器模型,性能超越 SOTA,通过去除填充和序列打包减少计算浪费,提高训练和推理的效率
|
3月前
|
JSON API PHP
天气预报免费API接口【地址查询版】使用教程
本文介绍了如何使用中国气象局官方数据提供的免费天气预报API接口,通过省份和地点查询指定地区当日天气信息。该接口由接口盒子支持,提供JSON格式数据、GET/POST请求方式,并需注册获取用户ID和KEY进行身份验证。
1958 2
|
数据可视化
Mlflow可视化学习笔记(一):可视化YOLOV4损失函数
这篇博客介绍了如何使用Mlflow可视化YOLOV4损失函数,并提供了安装指南、代码示例和运行程序的步骤。
166 0
Mlflow可视化学习笔记(一):可视化YOLOV4损失函数
|
机器学习/深度学习 人工智能 监控
一文读懂deepSpeed:深度学习训练的并行化
DeepSpeed 是由微软开发的开源深度学习优化库,旨在提高大规模模型训练的效率和可扩展性。通过创新的并行化策略、内存优化技术(如 ZeRO)及混合精度训练,DeepSpeed 显著提升了训练速度并降低了资源需求。它支持多种并行方法,包括数据并行、模型并行和流水线并行,同时与 PyTorch 等主流框架无缝集成,提供了易用的 API 和丰富的文档支持。DeepSpeed 不仅大幅减少了内存占用,还通过自动混合精度训练提高了计算效率,降低了能耗。其开源特性促进了 AI 行业的整体进步,使得更多研究者和开发者能够利用先进优化技术,推动了 AI 在各个领域的广泛应用。
|
机器学习/深度学习 自然语言处理 数据挖掘
从理论到实践:详解GraphRAG框架下的多模态内容理解与生成
【10月更文挑战第10天】随着多媒体内容的爆炸性增长,如何有效地理解和生成跨模态的数据(如图像、文本和视频)变得越来越重要。近年来,图神经网络(GNNs)因其在处理非结构化数据方面的强大能力而受到广泛关注。在此背景下,Graph Retrieval-Augmented Generation (GraphRAG) 框架作为一种新的方法,通过结合图检索和生成模型来提升多模态内容的理解与生成效果。本文将深入探讨GraphRAG的基本原理、核心组件以及实际应用,并通过代码示例展示其在多媒体内容处理中的潜力。
1638 0