开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 正文

Mlflow的核心功能是什么?

Mlflow的核心功能是什么?

展开
收起
游客lmkkns5ck6auu 2022-07-28 16:34:27 719 0
1 条回答
写回答
取消 提交回答
  • 1)Mlflow Tracking:它可以追踪基于学习的实验参数、模型的性能指标以及模型的各种文件。在做机器学习时实验时,通常需要记录一些参数配置以及模型的性能指标,而Mlflow可以帮助用户免去手动记录的操作。它不仅能记录参数,还能记录任意文件,包括模型、图片、源码等。

    2)Mlflow Project:基于代码规约来打包训练代码,并指定执行环境、执行入口以及参数等信息,以便复现实验结果。而且这种规范的打包方式能够更方便代码的共享以及平台的迁移。

    3)Mlflow Models:支持以统一的方式打包记录和部署多种算法框架模型。训练完模型后,可以使用Mlflow的log-model将模型记录下来,MIflow会自动将模型进行存储(可存储到本地或OSS上),而后即可在MIlow WebUl上查看模型与代码版本、参数和metric之间的关系,以及模型的存储路径。

    4)Mlflow Registry:Mlflow不但能够存储模型,还提供了WebUl以管理模型。WebUl界面上展示了模型的版本和所处的阶段,模型的详情页显示了模型的描述、标签以及schema。其中模型的标签可以用于检索和标记模型,模型的:chema用于表示模型输入和输出的格式。此外,Mlflow还建立了模型以及运行环境、代码和参数之间的关系即模型的血缘。

    以上内容摘自《Databricks数据洞悉》电子书,点击https://developer.aliyun.com/topic/download?id=8545可下载完整版

    2022-07-29 10:42:56
    赞同 展开评论 打赏

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

相关电子书

更多
基于streaming构建统一的数据处理引擎的挑战与实践 立即下载
混合应用平台构建实战 立即下载
分布式流处理框架——功能对比和性能评估 立即下载