基于Python构建机器学习Web应用

简介: 🏆🏆在本文中,我们基于之前的亚洲美食数据集构建了SVC模型,并介绍了模型可视化工具Netron与Onnx模型格式的使用。与之前基于Python的pkl格式模型相比,Onnx格式的模型适用性更好,可以在多个平台使用。且OnnxRuntime拥有各种语言的API,💻我们可以在各个环境中部署机器学习模型应用!



本文相关数据资源免费下载

       在本文中,你将学到:

0 如何构建模型并将其保存为Onnx模型

1 如何使用Netron可视化模型

2 如何在Web应用中使用模型进行预测

        📈 机器学习最有用的实际用途之一是构建推荐系统,今天我们可以朝着这个方向迈出第一步!

一、内容介绍

       在系列8的文章中,我们构建了一个基于UFO目击事件的回归模型,对其使用pickle库进行封装打包,并基于Flask库构建了Web应用,虽然这个打包方法简单易用,但是对于大多数Web应用,其构建环境是基于JavaScript语言的,因此使用一个JavaScript打包并使用模型更容易拓展和广泛应用。

1.Onnx模型

       构建机器学习模型应用是AI业务系统中的重要组成部分。通过使用Onnx,我们可以在各种Web应用程序中使用模型。Python的第三方库skl2onnx可以帮我们把Scikit-learn模型转换为Onnx模型。

       ONNX(Open Neural Network Exchange),开放神经网络交换,是用于在各种深度学习训练和推理框架转换的一个中间表示格式。在实际业务中,可以使用Pytorch或者TensorFlow训练模型,导出成ONNX格式,然后在转换成目标设备上支撑的模型格式,比如TensorRT Engine、NCNN、MNN等格式。ONNX定义了一组和环境,平台均无关的标准格式,来增强各种AI模型的可交互性,开放性较强。

①skl2onnx库安装

pip install -i https://mirrors.aliyun.com/pypi/simple/ skl2onnx

       看到下图信息代表安装成功:

2.Netron安装

       Netron是一个深度学习模型可视化库,其支持以下格式的模型存储文件:

ONNX (.onnx, .pb)

Keras (.h5, .keras)

CoreML (.mlmodel)

TensorFlow Lite (.tflite)

       netron并不支持pytorch通过torch.save方法导出的模型文件,因此在pytorch保存模型的时候,需要将其导出为onnx格式的模型文件,可以利用torch.onnx模块实现这一目标。

Netron安装链接

       安装好以后,双击即可运行,选中我们模型进行可视化查看。

二、模型构建

       首先,使用我们之前已清理的亚洲美食数据集训练SVC线性分类模型。

1.数据加载

       导入第三方库并调用查看之前处理好的亚洲美食数据集。

importpandasaspddata=pd.read_csv('cleaned_cuisines.csv')
data.head()

2.划分可训练特征与预测标签

       删去不需要的两列数据,并将剩余数据赋值给X,同理将标签另存为Y:

X=data.iloc[:,2:]#X为可训练特征Y=data['cuisine']#Y为预测标签

3.训练模型

①第三方库导入

       从Scikit-learn库中导入需要的函数:

fromsklearn.model_selectionimporttrain_test_split#用于数据集的划分fromsklearn.svmimportSVC#SVC模型fromsklearn.model_selectionimportcross_val_score#fromsklearn.metricsimportaccuracy_score,precision_score,confusion_matrix,classification_report#调用精度

②数据集划分

       将数据集以7:3的比例划分为训练集与测试集:

X_train, X_test, Y_train, Y_test=train_test_split(X,Y,test_size=0.3)

③SVC模型构建

       构建一个SVC模型,核函数为“linear”。使用划分好的训练集数据进行模型训练。

model=SVC(kernel='linear', C=10, probability=True,random_state=0)
model.fit(X_train,Y_train.values.ravel())

④精度评价

       用训练好的模型预测出预测标签Y_pred,并打印出精度评价表。

Y_pred=model.predict(X_test)
print(classification_report(Y_test,Y_pred))

二、模型转换及可视化

       在前文中,我们以及训练好了SVC模型,其精度达到了79%。现在我们需要将模型转换为Onnx格式。

确保使用正确的张量数进行转换,此数据集中有380个特征,因此我们需要在FloatTensorType函数中设定好特征数量。

1.参数配置

       配置好Onnx模型参数,如数据类型为Float,数据类型为[1,380]的张量。

fromskl2onnximportconvert_sklearnfromskl2onnx.commmon.data_typesimportFloatTensorTypeinitial_type= [('float_input',FloatTensorType([None, 380]))]
options= {id(model):{'nocl': True, 'zipmap': False}}

2.Onnx模型生成

       基于以上参数生成Onnx模型并保存在model.onnx文件中:

onx=convert_sklearn(model, initial_types=initial_type, options=options)
withopen("model.onnx", "wb") asf:
f.write(onx.SerializeToString())

       现在,我们可以在文件夹中看到Onnx模型。

3.可视化模型

       Onnx模型结构在代码中看起来并不是很明显,我们Netron软件来可视化模型。打开Netron软件,点击Open model,加载模型,选择我们刚刚生成的model.onnx文件。

       可以看到,模型的结构已被可视化,其中列出了380个特征输入与所用的分类器。我们可以点击不同的部分查看其数据类型,输出结果类型以及参数配置。

四、构建Web应用程序

       现在,我们已经准备在Web应用程序上使用此模型,首先,我们先构建一个Web应用程序。

1.构建HTML文件

       在文件夹下新建index.html,加入以下代码:(简单的Web代码,有点前端基础应该都能看懂)

<divclass="boxCont"><inputtype="checkbox"value="247"class="checkbox"><label>pear</label></div><divclass="boxCont"><inputtype="checkbox"value="77"class="checkbox"><label>cherry</label></div><divclass="boxCont"><inputtype="checkbox"value="126"class="checkbox"><label>fenugreek</label></div><divclass="boxCont"><inputtype="checkbox"value="302"class="checkbox"><label>sake</label></div><divclass="boxCont"><inputtype="checkbox"value="327"class="checkbox"><label>soy sauce</label></div><divclass="boxCont"><inputtype="checkbox"value="112"class="checkbox"><label>cumin</label></div></div><divstyle="padding-top:10px"><buttononClick="startInference()">预测</button></div></body>

tip:我们可以看到每个复选框都有一个值value,这个值是食材特征在模型张量中对应的索引。

2.构建JavaScript代码

       在标签下方继续构建JavaScript脚本。

<scriptsrc="https://cdn.jsdelivr.net/npm/onnxruntime-web@1.9.0/dist/ort.min.js"></script><script>//创建一个380的向量,并全部赋值为0constingredients=Array(380).fill(0);
//定义全局检查变量,用于获取复选框值    constchecks= [...document.querySelectorAll('.checkbox')];
//foreach语句是for语句特殊情况下的增强版本,简化了编程,提高了代码的可读性和安全性。    checks.forEach(check=> {
check.addEventListener('change', function() {
// toggle the state of the ingredient// based on the checkbox's value (1 or 0)ingredients[check.value] =check.checked?1 : 0;
        });
    });
//定义函数,检查check列表中是否有复选框被勾选,有则返回Ture,否则FalsefunctiontestCheckboxes() {
returnchecks.some(check=>check.checked);
    }
//构建异步加载函数asyncfunctionstartInference() {
letatLeastOneChecked=testCheckboxes()
if (!atLeastOneChecked) {
alert('请至少勾选一个复选框.');
return;
        }
try {
// 创建一个新的 sessio加载模型.    constsession=awaitort.InferenceSession.create('model.onnx');
alert('模型加载成功!')
//创建一个[1,380]的张量对象constinput=newort.Tensor(newFloat32Array(ingredients), [1, 380]);
constfeeds= { float_input: input };
alert('参数输入成功!')
//输入模型session并开始预测,将结果赋值给resultsconstresults=awaitsession.run(feeds);
//读取results的值并以弹出框的形式展示结果alert('你可以享受'+results.label.data[0] +' 的美味!')
        } catch (e) {
console.log(`模型加载失败!`);
console.error(e);
        }
    }
</script>

       代码解析:

0 我们首先创建了一个包含380个值的数组,值默认全为0,这些值需要设置好后输入到模型进行预测,我们可以通过是否勾选复选框来更改某些参数。

1 我们创建了一个复选框数组,当我们选中该复选框时,数组中对应位置的值则会发生变化,变为1。默认为0。

2 我们创建了一个函数testCheckboxes,用于检查是否选中复选框。

3 当按下按钮时,该函数被调用,如果存在被选中的复选框,则加载模型,开始预测结果。

3.测试Web程序

       在文件夹中选中双击我们建立的index.html软件,稍等片刻可以看到,界面已经加载出来。输入参数即可运行。

部分读者可能运行后没有效果,因为引入的js代码网站有墙。禁止访问,导致引入超时。读者可自行下载相关JavaScript代码,进行本地调用。

       🏆🏆至此,我们的Web应用测试成功!你可以将其部署到你的服务器上或者硬件上😁。

六、总结

       在本文中,我们基于之前的亚洲美食数据集构建了SVC模型,并介绍了模型可视化工具Netron与Onnx模型格式的使用。与之前基于Python的pkl格式模型相比,Onnx格式的模型适用性更好,可以在多个平台使用。且OnnxRuntime拥有各种语言的API,💻我们可以在各个环境中部署机器学习模型应用!


   如果觉得我的文章对您有帮助,三连+关注便是对我创作的最大鼓励!

“本站所有文章均为原创,欢迎转载,请注明文章出处:https://blog.csdn.net/qq_45590504/category_11752103.html?spm=1001.2014.3001.5482百度和各类采集站皆不可信,搜索请谨慎鉴别。技术类文章一般都有时效性,本人习惯不定期对自己的博文进行修正和更新,因此请访问出处以查看本文的最新版本。”

系列文章

机器学习系列0 机器学习思想_GISer Liu的博客-CSDN博客

机器学习系列1 机器学习历史_GISer Liu的博客-CSDN博客

机器学习系列2 机器学习的公平性_GISer Liu的博客-CSDN博客_公平机器学习

机器学习系列3 机器学习的流程_GISer Liu的博客-CSDN博客

机器学习系列4 使用Python创建Scikit-Learn回归模型_GISer Liu的博客-CSDN博客

机器学习系列5 利用Scikit-learn构建回归模型:准备和可视化数据(保姆级教程)_GISer Liu的博客-CSDN博客

机器学习系列6 使用Scikit-learn构建回归模型:简单线性回归、多项式回归与多元线性回归_GISer Liu的博客-CSDN博客_多元多项式回归

机器学习系列7 基于Python的Scikit-learn库构建逻辑回归模型_GISer Liu的博客-CSDN博客

机器学习系列8 基于Python构建Web应用以使用机器学习模型_GISer Liu的博客-CSDN博客

一文读懂机器学习分类全流程_GISer Liu的博客-CSDN博客

目录
相关文章
|
3月前
|
监控 数据可视化 数据挖掘
Python Rich库使用指南:打造更美观的命令行应用
Rich库是Python的终端美化利器,支持彩色文本、智能表格、动态进度条和语法高亮,大幅提升命令行应用的可视化效果与用户体验。
219 0
|
3月前
|
前端开发 JavaScript 开发者
JavaScript:构建动态Web的核心力量
JavaScript:构建动态Web的核心力量
|
4月前
|
数据采集 监控 Java
Python 函数式编程的执行效率:实际应用中的权衡
Python 函数式编程的执行效率:实际应用中的权衡
268 102
|
3月前
|
机器学习/深度学习 数据采集 算法
量子机器学习入门:三种数据编码方法对比与应用
在量子机器学习中,数据编码方式决定了量子模型如何理解和处理信息。本文详解角度编码、振幅编码与基础编码三种方法,分析其原理、实现及适用场景,帮助读者选择最适合的编码策略,提升量子模型性能。
255 8
|
3月前
|
机器学习/深度学习 算法 安全
【强化学习应用(八)】基于Q-learning的无人机物流路径规划研究(Python代码实现)
【强化学习应用(八)】基于Q-learning的无人机物流路径规划研究(Python代码实现)
213 6
|
3月前
|
设计模式 缓存 运维
Python装饰器实战场景解析:从原理到应用的10个经典案例
Python装饰器是函数式编程的精华,通过10个实战场景,从日志记录、权限验证到插件系统,全面解析其应用。掌握装饰器,让代码更优雅、灵活,提升开发效率。
242 0
|
4月前
|
数据采集 存储 数据可视化
Python网络爬虫在环境保护中的应用:污染源监测数据抓取与分析
在环保领域,数据是决策基础,但分散在多个平台,获取困难。Python网络爬虫技术灵活高效,可自动化抓取空气质量、水质、污染源等数据,实现多平台整合、实时更新、结构化存储与异常预警。本文详解爬虫实战应用,涵盖技术选型、代码实现、反爬策略与数据分析,助力环保数据高效利用。
260 0
|
4月前
|
存储 程序员 数据处理
Python列表基础操作全解析:从创建到灵活应用
本文深入浅出地讲解了Python列表的各类操作,从创建、增删改查到遍历与性能优化,内容详实且贴近实战,适合初学者快速掌握这一核心数据结构。
479 0
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
Java 大视界 -- Java 大数据机器学习模型在自然语言生成中的可控性研究与应用(229)
本文深入探讨Java大数据与机器学习在自然语言生成(NLG)中的可控性研究,分析当前生成模型面临的“失控”挑战,如数据噪声、标注偏差及黑盒模型信任问题,提出Java技术在数据清洗、异构框架融合与生态工具链中的关键作用。通过条件注入、强化学习与模型融合等策略,实现文本生成的精准控制,并结合网易新闻与蚂蚁集团的实战案例,展示Java在提升生成效率与合规性方面的卓越能力,为金融、法律等强监管领域提供技术参考。
|
4月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在生物信息学基因功能预测中的优化与应用(223)
本文探讨了Java大数据与机器学习模型在生物信息学中基因功能预测的优化与应用。通过高效的数据处理能力和智能算法,提升基因功能预测的准确性与效率,助力医学与农业发展。

热门文章

最新文章

推荐镜像

更多