Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略

简介: Python之nyoka:nyoka库函数的简介、安装、使用方法之详细攻略

nyoka库函数的简介


    Nyoka是一个全面支持最新PMML (PMML 4.4)标准的Python库。使用Nyoka,数据科学家可以出口大量的机器学习和深度学习从流行的Python框架PMML模型通过使用任何众多包括现成的出口商或通过创建自己的专业出口商/个人模型类型通过构造函数的调用序列。

    除了大约500 Python类,每个封面PMML标签和所有构造函数参数/属性中定义的标准,Nyoka还提供了越来越多的方便的类和函数,简化数据科学家的生活例如通过阅读或编写任何PMML文件在一行代码中你最喜欢的Python环境。

    Nyoka提供了完整的Python源代码,扩展的HTML类/函数文档,以及越来越多的Jupyter笔记本教程,帮助您熟悉Nyoka支持您使用PMML作为您最喜欢的数据科学传输文件格式的方式。


Nyoka文档:https://softwareag.github.io/nyoka/



1、Nyoka的核心模块


Statsmodels Exporter Module

Keras Exporter Module

RetinaNet Exporter Module

LightGBM Exporter Module

Pre-Processing Exporter Module

Scikit-Learn Exporter Module

XGBoost Exporter Module

ExponentialSmoothing Exporter Module

Nyoka's Pre-Processing Module

Enums Module


2、模型


(1)、基础模型


linear_model.LinearRegression

linear_model.LogisticRegression

linear_model.RidgeClassifier

linear_model.SGDClassifier

discriminant_analysis.LinearDiscriminantAnalysis

tree.DecisionTreeClassifier

tree.DecisionTreeRegressor

svm.SVC

svm.SVR

svm.LinearSVC

svm.LinearSVR

svm.OneClassSVM

naive_bayes.GaussianNB

ensemble.RandomForestRegressor

ensemble.RandomForestClassifier

ensemble.GradientBoostingRegressor

ensemble.GradientBoostingClassifier

ensemble.IsolationForest

neural_network.MLPClassifier

neural_network.MLPRegressor

neighbors.KNeighborsClassifier

neighbors.KNeighborsRegressor

cluster.KMeans

(2)、LightGBM:


LGBMClassifier

LGBMRegressor

(3)、XGBoost (version <= 0.90):


XGBClassifier

XGBRegressor

(4)、Statsmodels (version <= 0.11.1):


tsa.arima_model.ARIMA

tsa.arima.model.ARIMA (In statespace form)

tsa.statespace.SARIMAX

tsa.statespace.VARMAX

tsa.statespace.ExponentialSmoothing




nyoka库函数的安装


pip install nyoka

pip install --user -i https://pypi.tuna.tsinghua.edu.cn/simple nyoka


image.png






nyoka库函数的使用方法


1、Nyoka为每个库包含独立的导出程序,例如scikit-learn、keras、xgboost等。


library exporter

scikit-learn skl_to_pmml

xgboost xgboost_to_pmml

lightgbm lgbm_to_pmml

keras KerasToPmml

statsmodels StatsmodelsToPmml & ExponentialSmoothingToPmml

retinanet RetinanetToPmml


2、基于StandardScaler的决策树分类器案例


from sklearn.pipeline import Pipeline

from sklearn.tree import DecisionTreeClassifier

from sklearn.preprocessing import StandardScaler

pipeline_obj = Pipeline([

        ("scaler",StandardScaler()),

        ("model",DecisionTreeClassifier())

])

from sklearn.dataset import load_iris

iris_data = load_iris()

X = iris_data.data

y = iris_data.target

features = iris_data.feature_names

pipeline_obj.fit(X,y)

from nyoka import skl_to_pmml

skl_to_pmml(pipeline=pipeline_obj,col_names=features,target_name="species",pmml_f_name="decision_tree.pmml")




3、LGBMClassifier → PMML


import pandas as pd

from sklearn import datasets

from sklearn.pipeline import Pipeline

from lightgbm import LGBMRegressor,LGBMClassifier

from nyoka import lgb_to_pmml

iris = datasets.load_iris()

irisd = pd.DataFrame(iris.data,columns=iris.feature_names)

target = 'Species'

irisd[target] = iris.target

features = irisd.columns.drop(target)

#保存模型

pipeline_obj = Pipeline([ ('lgbmc',LGBMClassifier())])

pipeline_obj.fit(irisd[features],irisd[target])

lgb_to_pmml(pipeline_obj,features,target,"lgbmc_pmml.pmml")

#读入数据进行测试

auto = pd.read_csv('auto-mpg.csv')

X = auto.drop(['mpg','car name'], axis=1)

y = auto['mpg']

feature_names = [name for name in auto.columns if name not in ('mpg','car name')]

target_name='mpg'

pipeline_obj = Pipeline([ ('lgbmr',LGBMRegressor()) ])

pipeline_obj.fit(auto[feature_names],auto[target_name])

lgb_to_pmml(pipeline_obj,feature_names,target_name,"lgbmr_pmml.pmml")


4、基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理


ML之nyoka:基于nyoka库利用LGBMClassifier模型实现对iris数据集训练、保存为pmml模型并重新载入pmml模型进而实现推理



相关文章
|
5天前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
40 1
|
5天前
|
算法 Java Docker
(Python基础)新时代语言!一起学习Python吧!(三):IF条件判断和match匹配;Python中的循环:for...in、while循环;循环操作关键字;Python函数使用方法
IF 条件判断 使用if语句,对条件进行判断 true则执行代码块缩进语句 false则不执行代码块缩进语句,如果有else 或 elif 则进入相应的规则中执行
56 1
|
5天前
|
Java 数据处理 索引
(numpy)Python做数据处理必备框架!(二):ndarray切片的使用与运算;常见的ndarray函数:平方根、正余弦、自然对数、指数、幂等运算;统计函数:方差、均值、极差;比较函数...
ndarray切片 索引从0开始 索引/切片类型 描述/用法 基本索引 通过整数索引直接访问元素。 行/列切片 使用冒号:切片语法选择行或列的子集 连续切片 从起始索引到结束索引按步长切片 使用slice函数 通过slice(start,stop,strp)定义切片规则 布尔索引 通过布尔条件筛选满足条件的元素。支持逻辑运算符 &、|。
45 0
|
16天前
|
设计模式 缓存 监控
Python装饰器:优雅增强函数功能
Python装饰器:优雅增强函数功能
220 101
|
4天前
|
数据可视化 关系型数据库 MySQL
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
本文详解基于Python的电影TOP250数据可视化大屏开发全流程,涵盖爬虫、数据存储、分析及可视化。使用requests+BeautifulSoup爬取数据,pandas存入MySQL,pyecharts实现柱状图、饼图、词云图、散点图等多种图表,并通过Page组件拖拽布局组合成大屏,支持多种主题切换,附完整源码与视频讲解。
51 4
【可视化大屏】全流程讲解用python的pyecharts库实现拖拽可视化大屏的背后原理,简单粗暴!
|
13天前
|
传感器 运维 前端开发
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
本文解析异常(anomaly)与新颖性(novelty)检测的本质差异,结合distfit库演示基于概率密度拟合的单变量无监督异常检测方法,涵盖全局、上下文与集体离群值识别,助力构建高可解释性模型。
182 10
Python离群值检测实战:使用distfit库实现基于分布拟合的异常检测
|
Linux 开发工具 C语言
30天python速成-第一天(python简介及下载安装)
30天python速成-第一天(python简介及下载安装)
|
Linux 开发者 iOS开发
|
开发框架 数据可视化 Java
Python Qt GUI设计简介、环境下载和安装(基础篇—1)
Python Qt GUI设计简介、环境下载和安装(基础篇—1)
Python Qt GUI设计简介、环境下载和安装(基础篇—1)
|
SQL Oracle 数据可视化
Indigo | Indigo(Python)简介、安装与入门
Indigo | Indigo(Python)简介、安装与入门
612 0
Indigo | Indigo(Python)简介、安装与入门

推荐镜像

更多