文档备案控制台

开发者社区 ModelScope模型即服务文章正文

使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践| 学习笔记（二）

2022-11-24 845

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践

开发者学堂课程【Databricks数据洞察公开课：使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/1058/detail/15565

使用 Databricks 和 MLflow 进行机器学习模型训练和部署的应用实践

Anaconda 的安装包已经下载好了，下一步,要把 conda 的路径添加到系统路径中。

ecal “s(/root/anaconda3/bin/conda shell.bash hook)”

然后，初始化 Conda

conda init

紧接着去创建一个新的 Anaconda 的环境

conda create-n m\flow-server

然后去激活这个环境。

conda activate m\flow-server

在这个新的环境中，我们去安装 python 3.9。

conda install pathon=3.9

conda install pymysql

由于，Mlflow server 需要将原数据存储到数据库中，所以，还需要 python 到Mysql的 connecter ，接着就可以使用 pip 去安装Mlflow Server。

Mlflow Server安装好之后需要在 Mysql 里创建一个新的数据库用来存储 Mlflow Server 的一些原数据信息，然后需要设置一些环境变：MLFLOW_OSS_ENDPOINT_URL=”

http://oss-cn-beijing.aliyuncs.com/mlflow-demo

这个环境变量是 OSS 的ENDPOINT 的URL ，它的组成是oss 以及地域和 OSS Bucket ，下方是AK ，AK KEY 和 AK SECRET。

此外这里需要用到 Mlflow 和 OSS 的 conducter ，需要下载安装包，然后再在本地区安装，已经在本地下载好了后，直接在这个路径下执行 pip install ，如下图。

之后就可以在这个机器上启动一个Mlflow Server ， Mlflow 的 Web UI 是开在5000端口，如下图：

可以看到Mlflow Server 已经运行起来了，但是目前这里还没有实验，也没有模型， Mlflow Server 环境搭建好之后，就可以在 DDI 的 notebook 上进行操作，首先把需要的包都给导入进来，然后需要设置三个环境变量，如下图：

和前面的 ECS Server 设置的环境变量是一致的，再去设置一下 log 的级别，如下图：

还有下图定义了一个计算均方误差，平均绝对误差和 R2 的一个函数，这是用来计算模型的相应的指标的。

之后，将 OSS 中的训练数据加载进来，下图是红酒质量数据，对应的每一行的是红酒的酸碱度，然后还有含糖量以及酒精含量等等这些信息，最后一列呢是这个酒的质量

把这些数据加载进来，加载完成后，我们先把它转成 Pandas ，

Pandas 的data free ，然后把它分割成训练集和测试集

然后，使用 SK LUNCH 去搭建一个简单的线性回归的模型，这里的参数设置为0.6和0.1如下图：

然后需要去设置tracking server的 uri ，使用的是内网的地址： http://10.0.0.246：5000/

之后去创建一个实验环境，这个实验环境的名称叫 wine quality ，还需要设置模芯的存储地址，是存储到 models 里。

环境创建好之后，就可以开启一次实验，开启一次实验与打开一个文件是类似的，使用 with 语句，然后start run 方法就可以开启一次实验。

首先去把参数给记录下来，再使用这个 log_param 的 alpha 还有 l1_racial这两个参数记录下来，去创建一个简单的线性回归模型，之后使用train_x，train_y去训练这个模型，再计算这个模型的性能指标，再使用 log metric 把这些性能指标给记录下来，最后还需要把训练好的模型给记录下来，在这个 Mlflow 的这个 Web UI 上，可以看到实验以及这次实验产生的模型，还有性能指标以及参数。

在这次实验的详情页面，可以看到这次实验的详细的信息，比如参数、性能指标，还可以为这次实验打上一些标签，方便快速的去检索这个这次实验。

还有这次实验相关的一些 Artifacts ，包括了模型的参数、执行环境、以及这次训练得到的模型。

参数：执行环境：模型：

再次回到这个 DDI的这个notebook ，去修改一下 alpha 和 r1_ratio ，再次去执行一次实验。

多修改几次：

在 Mlflow 的这个界面，就会看到新生成了两次实验。

并且可以将两次实验进行一个简单的对比，可以对比它们的性能指标和参数之间的关系。

在 Models 里可以看到，4次执行的这些模型以及它的版本。

可以把这个模型标记一下，标记为它目前处于什么阶段，它是出于那个 Staging阶段还是处于生产的阶段。

Mlflow的模型部署也非常的简单，比如这次实验它的性能不错，那要如何去部署它，先把Model 的 OSS path copy下来。

只需要在 ECS server上去执行这样一条指令。

模型已经部署在12345端口

可以使用personnel 调用模型得到推断的结果。

使用 Post 方法。在 Body 面传入相应的参数。调用接口就可以得到反馈结果。

从开始一次实验去训练模型到模型的部署，整个流程都可以通过 Mlflow 去搞定，而且 Mlflow UI上会显示所有的实验以及所有训练好的模型。

文章标签：

对象存储

Python

机器学习/深度学习

弹性计算

关系型数据库

对象存储

MySQL

数据库

存储

开发者

关键词：

人工智能平台 PAI训练

人工智能平台 PAI模型

人工智能平台 PAI应用

人工智能平台 PAI部署

人工智能平台 PAI模型应用

相关实践学习

对象存储OSS快速上手——如何使用ossbrowser

本实验是对象存储OSS入门级实验。通过本实验，用户可学会如何用对象OSS的插件，进行简单的数据存、查、删等操作。

阿里云社区

目录

相关文章

探索云世界

|

10月前

|

人工智能自然语言处理 IDE

模型微调不再被代码难住！PAI和Qwen3-Coder加速AI开发新体验

通义千问 AI 编程大模型 Qwen3-Coder 正式开源，阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型，并可在交互式建模环境中使用 Qwen3-Coder 模型。

探索云世界

1467 109 110

Deephub

|

10月前

|

机器学习/深度学习数据采集算法

量子机器学习入门：三种数据编码方法对比与应用

在量子机器学习中，数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法，分析其原理、实现及适用场景，帮助读者选择最适合的编码策略，提升量子模型性能。

Deephub

814 8 8

阿里云大数据Al技术

|

11月前

|

人工智能自然语言处理运维

【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型

阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型，提供企业级部署方案。

阿里云大数据Al技术

798 3 3

青云交（Java大数据AI云原生Python）

|

11月前

|

机器学习/深度学习人工智能自然语言处理

Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用（229）

本文深入探讨Java大数据与机器学习在自然语言生成（NLG）中的可控性研究，分析当前生成模型面临的“失控”挑战，如数据噪声、标注偏差及黑盒模型信任问题，提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略，实现文本生成的精准控制，并结合网易新闻与蚂蚁集团的实战案例，展示Java在提升生成效率与合规性方面的卓越能力，为金融、法律等强监管领域提供技术参考。

青云交（Java大数据AI云原生Python）

421 0 0

青云交（Java大数据AI云原生Python）

|

11月前

|

机器学习/深度学习算法 Java

Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用（223）

本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法，提升基因功能预测的准确性与效率，助力医学与农业发展。

青云交（Java大数据AI云原生Python）

498 0 0

青云交（Java大数据AI云原生Python）

|

11月前

|

机器学习/深度学习搜索推荐数据可视化

Java 大视界 -- Java 大数据机器学习模型在电商用户流失预测与留存策略制定中的应用（217）

本文探讨 Java 大数据与机器学习在电商用户流失预测与留存策略中的应用。通过构建高精度预测模型与动态分层策略，助力企业提前识别流失用户、精准触达，实现用户留存率与商业价值双提升，为电商应对用户流失提供技术新思路。

青云交（Java大数据AI云原生Python）

531 0 0

青云交（Java大数据AI云原生Python）

|

11月前

|

机器学习/深度学习存储分布式计算

Java 大视界 --Java 大数据机器学习模型在金融风险压力测试中的应用与验证（211）

本文探讨了Java大数据与机器学习模型在金融风险压力测试中的创新应用。通过多源数据采集、模型构建与优化，结合随机森林、LSTM等算法，实现信用风险动态评估、市场极端场景模拟与操作风险预警。案例分析展示了花旗银行与蚂蚁集团的智能风控实践，验证了技术在提升风险识别效率与降低金融风险损失方面的显著成效。

青云交（Java大数据AI云原生Python）

648 0 0

游客rj7kdyude6p6g

|

9月前

|

机器学习/深度学习数据采集人工智能

【机器学习算法篇】K-近邻算法

K近邻（KNN）是一种基于“物以类聚”思想的监督学习算法，通过计算样本间距离，选取最近K个邻居投票决定类别。支持多种距离度量，如欧式、曼哈顿、余弦相似度等，适用于分类与回归任务。结合Scikit-learn可高效实现，需合理选择K值并进行数据预处理，常用于鸢尾花分类等经典案例。（238字）

游客rj7kdyude6p6g

2278 7 7

龙大吉

|

机器学习/深度学习算法数据挖掘

K-means聚类算法是机器学习中常用的一种聚类方法，通过将数据集划分为K个簇来简化数据结构

K-means聚类算法是机器学习中常用的一种聚类方法，通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理，包括初始化、数据点分配与簇中心更新等步骤，以及如何在Python中实现该算法，最后讨论了其优缺点及应用场景。

龙大吉

1843 6 6

martinzh717

|

机器学习/深度学习数据采集人工智能

20分钟掌握机器学习算法指南

在短短20分钟内，从零开始理解主流机器学习算法的工作原理，掌握算法选择策略，并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻，帮助你告别算法选择的困惑，轻松踏入AI的大门。

martinzh717

984 8 10

ModelScope模型即服务

热门文章

最新文章

2026 最新Stable Diffusion 本地部署教程下载安装使用详细图解（含官网安装包）

高效部署通义万相Wan2.1：ComfyUI文生/图生视频实战，工作流直取！

嵌入式开发必备！Keil uVision5 C51 V9.61 安装激活 + 汉化完整教程, 含（Keil MDK 5.39）

MNN-LLM App：在手机上离线运行大模型，阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用

Claude Code 四大定制机制完全指南：CLAUDE.md、Hooks、Skills、Subagents 怎么选怎么用

GLM-4V-Flash：智谱 AI 免费开放的图像理解大模型 API 接口

DeepSeek-V4开源：百万上下文，Agent能力比肩顶级闭源模型

Hermes Agent：深度技术剖析报告

Codex 完整避坑指南（2026 版）：沙箱、权限、AGENTS.md、Worktree 七类坑一次讲清

Claude Code 配置文件怎么写：settings.json 与 CLAUDE.md 完整指南

告别纸质手册：AR如何重塑一线员工的操作培训体验

Codex 接入 Claude Fable 5：CLI 与桌面端配置完整教程

告别无效出差：AR远程协作如何重塑企业运维效率

从零搓一个语言模型，然后把它变成认知体的声带

分层结构化决策对话智能体灵钥 V5.1 全新升级｜具备观点边界、关系感知的深度思辨 Agent，配套线上 Demo 与真实用户数据采集方案

告别单轮静态测评！WorldForge 多动态环境基准，量化 Agent 组件协同能力

告别纸质记录：AR现场巡检如何重塑工业运维效率

企业AI中台为什么要把AI工作助理放在第一优先级！

AR智能巡检：让一线工人拥有“透视”设备的超能力

Agent 工程里，上下文工程为什么比 Prompt 更重要？

相关产品

人工智能平台 PAI

文档详情产品详情

相关课程

更多

PAI平台学习路线：机器学习入门到应用

场景实践 - 机器学习PAI实现精细化营销

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

场景实践 - 基于机器学习进行收入预测分析

机器学习概览及常见算法

机器学习入门-概念原理及常用算法

相关电子书

更多

机器学习在恶意样本检测方面的实践之路

大规模机器学习在蚂蚁+阿里的应用

阿里巴巴机器学习平台AI

相关实验场景

更多

使用PAI+LLaMA Factory微调Qwen2-VL模型，搭建文旅领域知识问答机器人

在PAI ArtLab一键设计AIGC新春红包

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！