Python简化代码机器学习库PyCaret 2.0发布

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 该脚本动态选择并保存最佳模型。只需要短短几行代码,你就开发好了自己的AutoML软件,还带有完整的日志系统和漂亮榜单的UI界面。

“ 我们激动的宣布,PyCaret第二版今天发布!”


官网链接https://pycaret.org/


PyCaret是一个开源的,低代码的Python机器学习库,旨在自动化机器学习工作流。它是端到端的机器学习和模型管理工具。它可以加速机器学习的实验周期,提高你的效率。


和其他开源机器学习库相比,PyCaret是低代码的。它可以用几个单词取代上百行代码。这大大提高了实验的速度和效率。在版本说明release notes 中查看PyCaret 2.0的更多细节。


为什么要用PyCaret


PyCaret 2.0 功能


640.png


数据准备 模型训练 超参数调优(从左到右)

分析和截图 模型选择 实验日志记录(从左到右)


安装PyCaret 2.0


安装PyCaret非常简单,只需要几分钟时间。我们强烈建议使用虚拟环境,以避免和其他库的潜在冲突。以下示例代码创建了一个conda环境,并在该conda环境下安装pycaret


640.png


如果你使用Azure notebook或者Google Colab,运行下列代码安装PyCaret


640.png


所有的依赖项会在使用pip安装PyCaret时自动安装。点击Click here这里查看完整的依赖列表。


开始PyCaret 2.0


在PyCaret中,任何机器学习实验的第一步是配置环境。这需要导入相关模型并通过传递数据框(dataframe)和目标变量的名字来初始化配置函数。示例代码如下:


640.png


输出示例:


640.png


输出片段


所有的预处理变换在配置函数中被调用。PyCaret提供了超过20种不同的,可在配置函数内调用的预处理变换。点击这里 Click here 了解PyCaret更多的预处理能力。


640.png


  • 样本和划分:训练/测试划分;采样
  • 数据准备:缺失数据补全;独热编码;内在顺序编码;Cardinal编码;不平衡修正
  • 缩放和转换:归一化;转换
  • 特征工程:特征交互;多项式特征;组特征;二元数值特征
  • 特征选择:特征重要性;共线性移除;PCA;忽略低方差
  • 无监督:创建聚类;异常移除


https://www.pycaret.org/preprocessing


模型比较


这是所有监督学习模型任务中,我们推荐的第一步。该函数会使用模型的默认超参数来训练所有模型,并通过交叉检验来评估性能。它返回一个已训练的模型的对象类。可使用的评估测度包括:


  • 分类:准确度,AUC,召回率,精确率,F1,Kappa,MCC
  • 回归:MAE, MSE, RMSE, R2, RMSLE, MAPE


这里有几种使用 compare_models 函数的方法:


640.png


输出示例:


640.png


模型创建


模型创建函数使用默认超参数训练模型并使用交叉验证评估模型性能。该函数是几乎所有其他PyCaret函数的底。它返回训练模型对象类。以下是几种模型使用方法:


640.png


输出示例:


640.png


create_model函数的输出示例


要了解更多关于模型创建函数,点击这里 click here.


模型调优


模型调优函数以估计器的形式调优模型超参数。它在预设定的调优网格( 可完全定制化 )上进行随机网格搜索。以下是几种函数使用方法:


640.png


要了解更多模型调优函数,点击这里click here.


模型集成


有几种函数可用于集成底学习器。ensemble_model, blend_models 和stack_models是其中三种。以下是几种函数使用方法:


640.png


要了解更多模型集成函数,点击这里click here.


模型预测


和名字一样,该函数用于推理/预测。以下是使用方法:


640.png


模型作图


模型作图函数可用于评估训练已完成的机器学习模型的性能评估。示例如下:


640.png

640.png


plot_model函数的输出示例


另外,你可以在notebook的用户交互界面中使用 evaluate_model 函数来查看图


640.png


PyCaret中的 evaluate_model函数


Util函数


PyCaret 2.0包括了几种新的util函数。当你在PyCaret中管理机器学习实验时可以方便的使用。其中一些如下所示:


640.png


在发布说明 release notes. 中查看PyCaret 2.0中所有的新函数,


Experiment日志


PyCaret 2.0以后端API的形式嵌入了机器学习工作流的追踪组件,并提供UI在你运行机器学习代码时记录参数,代码版本,度量以及输出文件,以供之后的结果可视化。你可以如下记录你PyCaret中的实验:


640.png


输出(在 localhost:5000 )


640.png


整合——创建你自己的AutoML软件


通过使用这些函数,让我们创建一个简单的命令行软件来使用默认参数来训练多个模型,对最好的几个候选模型进行超参数调优,尝试不同的集成技术并返回/保存最优模型。以下是命令行脚本:


640.png


该脚本动态选择并保存最佳模型。只需要短短几行代码,你就开发好了自己的AutoML软件,还带有完整的日志系统和漂亮榜单的UI界面。


通过这个轻量级工作流自动化Python库,你可以完成无限可能。

相关实践学习
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
使用PAI和LLaMA Factory框架,基于全参方法微调 Qwen2-VL模型,使其能够进行文旅领域知识问答,同时通过人工测试验证了微调的效果。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
11天前
|
机器学习/深度学习 算法 安全
【PSO-LSTM】基于PSO优化LSTM网络的电力负荷预测(Python代码实现)
【PSO-LSTM】基于PSO优化LSTM网络的电力负荷预测(Python代码实现)
|
13天前
|
调度 Python
微电网两阶段鲁棒优化经济调度方法(Python代码实现)
微电网两阶段鲁棒优化经济调度方法(Python代码实现)
|
13天前
|
供应链 新能源 调度
微电网调度(风、光、储能、电网交互)(Matlab&Python代码实现)
微电网调度(风、光、储能、电网交互)(Matlab&Python代码实现)
|
14天前
|
安全 数据处理 Python
Python 函数式编程:让代码更简洁高效
Python 函数式编程:让代码更简洁高效
320 107
|
9天前
|
程序员 测试技术 开发者
Python装饰器:简化代码的强大工具
Python装饰器:简化代码的强大工具
134 92
|
12天前
|
机器学习/深度学习 数据采集 算法
【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法(Python&matlab代码实现)
【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法(Python&matlab代码实现)
|
10天前
|
运维 算法 新能源
基于风光储能和需求响应的微电网日前经济调度(Python代码实现)
基于风光储能和需求响应的微电网日前经济调度(Python代码实现)
|
11天前
|
机器学习/深度学习 算法 调度
【切负荷】计及切负荷和直流潮流(DC-OPF)风-火-储经济调度模型研究【IEEE24节点】(Python代码实现)
【切负荷】计及切负荷和直流潮流(DC-OPF)风-火-储经济调度模型研究【IEEE24节点】(Python代码实现)
|
12天前
|
机器学习/深度学习 算法 调度
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究(Python代码实现)
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究(Python代码实现)

推荐镜像

更多