SPSS多层感知器 (MLP)神经网络预测全国污染物综合利用量数据

简介: SPSS多层感知器 (MLP)神经网络预测全国污染物综合利用量数据

全文链接:https://tecdat.cn/?p=33380

随着全球经济的不断发展,污染物的排放和环境污染问题日益严重。解决这一问题的关键在于有效地利用污染物资源,以降低对环境的负面影响点击文末“阅读原文”获取完整代码数据


综合利用污染物资源不仅有助于减少所需的原材料消耗,还有助于降低环境排放和废物处理的成本。因此,探索和预测全国污染物综合利用量数据,对于制定相关政策和促进可持续发展至关重要。

传统的污染物综合利用量数据预测方法主要基于统计模型,但其在处理非线性复杂关系时表现出局限性。近年来,神经网络模型作为一种强大的数据建模工具,被广泛应用于各个领域的预测和决策支持任务。在本研究中,我们将利用SPSS工具基于多层感知器(MLP)神经网络来预测全国污染物综合利用量数据。

本研究的目标是通过构建一个可靠的预测模型,帮助客户分析并预测未来全国范围内的污染物综合利用量。首先,我们将收集并整理全国各地的污染物综合利用量数据,并进行预处理以消除异常值和缺失数据。接下来,我们将使用SPSS工具中的MLP神经网络算法,通过对历史数据的学习和训练,建立一个能够准确预测未来污染物综合利用量的模型。


多层感知器 (MLP)


在多层感知器(MLP)对话框中,你可以选择你想包含在模型中的变量。用神经网络技术探索数据的结果可以用多种图形格式表示。这个简单的条形图是多种选择中的一种。

所示的多层感知器,数据前馈式通过输入层、隐藏层传递到输出层。

■ 选项“结构”用来设置神经网络的结构,您可以设定:  

– 是否使用自动选择结构– 神经网络的隐藏层个数

– 隐藏层单元之间的激活函数(双曲函数或者S型函数)– 输出层单元之间的激活函数(标识,双曲, S型, SoftMax函数)

MLP通过多层感知器来拟合神经网络。多层感知器是一个前馈式有监督的结构。它可以包含多个隐藏层。一个或者多个因变量,这些因变量可以是连续型、分类型、或者两者的结合。如果因变量是连续型,神经网络预测的连续值是输入数据的某个连续函数。如果因变量是分类型,神经网络会根据输入数据,将记录划分为最适合的类别。


确定被解释变量和解释变量


被解释变量:污染物综合利用量(Y, Utility)

解释变量:

(1)     目标变量:污染物综合产生量(X1, Generate),作为污染物综合利用量的主要来源,污染物综合产生量(X1)的预测方向主要为与污染物综合利用量(Y)呈正相关关系,即污染物综合产生量越大,污染物综合利用量也越大。

(2)     控制变量:

国内生产总值(X3,GDP)(选取第二产业的国内生产总值),作为污染物综合利用量的主要控制变量,国内生产总值(X3)的预测方向主要为与污染物综合利用量(Y)呈正相关关系,即国内生产总值越大,污染物综合利用量也越大。

绿地面积(X2, Green),作为污染物综合利用量的主要去向,绿地面积(X2)的预测方向主要为与污染物综合利用量(Y)呈正相关关系,即绿地面积越大,污染物综合利用量也越大。

image.png

设置模型参数


分别设置因变量和自变量

image.png

点击标题查阅往期内容


TensorFlow 2keras开发深度学习模型实例:多层感知器(MLP),卷积神经网络(CNN)和递归神经网络(RNN)


01

02

03

04


image.png


确定训练集和测试集的比列


用神经网络技术探索数据的结果可以用多种图形格式表示。

image.png

得到模型的结果

image.png

首先得到是模型的训练误差。误差在0.04左右说明模型拟合较好,相对误差在0.01左右。

Network Information


Input Layer Factors 1 Numbers
2 Generate(X1)

3 Green(X2)

4 GDP(X3)


Number of Unitsa 310
Hidden Layer(s)
Number of Hidden Layers 1
Number of Units in Hidden Layer 1a 13

Activation Function Hyperbolic tangent

Output Layer Dependent Variables 1 Utilize(Y)
Number of Units 1

Rescaling Method for Scale Dependents Standardized

Activation Function Identity

Error Function Sum of Squares

a. Excluding the bias unit


然后是神经网络的特征信息,该模型一共有1个隐藏层 13个神经元

然后得到神经网络的预测值

image.png

和预测的残差值

image.png

可以看到预测的残差均匀分布在0线周围。说明模型拟合较好。

然后输出模型的重要变量。

基于神经网络的属性重要性评价是以神经网络为模型来衡量模型中输入变量对模型输出的影响程度。它一方面可以神经网络为工具,按照重要性对属性排序;另一方面还可增加神经网络的解释性、减少网络的复杂度、简化网络的结构、提高网络的泛化能力。从结果中可以看到number是最重要的变量们其次是污染物综合产生量 然后是绿地面积 然后是GDP,最后是year。

自变量的重要性


重要性 标准化的重要性
Numbers .327 100.0%
Generate(X1) .195 59.5%
Green(X2) .233 71.2%
GDP(X3) .206 62.9%
Year .039 11.8%

image.png

代码:

*Multilayer Perceptron Network. MLP UtilizeY (MLEVEL=S) BY Numbers GenerateX1 GreenX2 GDPX3   /PARTITION  VARIABLE=Year
相关文章
|
14小时前
|
机器学习/深度学习 搜索推荐 知识图谱
图神经网络加持,突破传统推荐系统局限!北大港大联合提出SelfGNN:有效降低信息过载与数据噪声影响
【7月更文挑战第22天】北大港大联手打造SelfGNN,一种结合图神经网络与自监督学习的推荐系统,专攻信息过载及数据噪声难题。SelfGNN通过短期图捕获实时用户兴趣,利用自增强学习提升模型鲁棒性,实现多时间尺度动态行为建模,大幅优化推荐准确度与时效性。经四大真实数据集测试,SelfGNN在准确性和抗噪能力上超越现有模型。尽管如此,高计算复杂度及对图构建质量的依赖仍是待克服挑战。[详细论文](https://arxiv.org/abs/2405.20878)。
8 5
|
8天前
|
机器学习/深度学习 算法 数据挖掘
基于改进K-means的网络数据聚类算法matlab仿真
**摘要:** K-means聚类算法分析,利用MATLAB2022a进行实现。算法基于最小化误差平方和,优点在于简单快速,适合大数据集,但易受初始值影响。文中探讨了该依赖性并通过实验展示了随机初始值对结果的敏感性。针对传统算法的局限,提出改进版解决孤点影响和K值选择问题。代码中遍历不同K值,计算距离代价,寻找最优聚类数。最终应用改进后的K-means进行聚类分析。
|
6天前
|
SQL 安全 算法
网络安全与信息安全:保护数据的关键策略
【7月更文挑战第17天】在数字化时代的浪潮中,网络安全和信息安全的重要性日益凸显。本文将深入探讨网络安全漏洞的成因、影响以及防范措施,同时分析加密技术在保障信息传输安全中的应用,并强调提高个人与企业的安全意识在防御网络威胁中的核心作用。文章旨在为读者提供全面的网络安全知识框架,帮助构建更为坚固的防护墙,确保数据资产的安全。
|
10天前
|
机器学习/深度学习 PyTorch 算法框架/工具
图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型(如卷积神经网络CNN和循环神经网络RNN)不同,
图神经网络是一类用于处理图结构数据的神经网络。与传统的深度学习模型(如卷积神经网络CNN和循环神经网络RNN)不同,
|
1月前
|
XML 数据采集 前端开发
四:《智慧的网络爬虫》— 数据解析之xpath解析
本篇文章主要讲述了数据解析中的xpath解析,及相对路径的定位语法。最后以爬取豆瓣top250首页作为示例总结
47 5
四:《智慧的网络爬虫》—  数据解析之xpath解析
|
19天前
|
安全 算法 网络安全
网络安全与信息安全:保护数据的关键策略
【7月更文挑战第4天】在数字化时代,网络安全和信息安全已成为组织和个人不可忽视的议题。本文将深入探讨网络安全漏洞的成因、当前加密技术的应用以及提升安全意识的重要性。文章旨在为读者提供一套综合性的知识体系,帮助他们更好地理解和应对网络环境中的安全威胁。
28 3
|
26天前
|
JSON 数据可视化 API
技术心得:如何用Python和API收集与分析网络数据?
技术心得:如何用Python和API收集与分析网络数据?
24 2
|
8天前
|
JSON 数据挖掘 API
在会议系统工程中,Python可以用于多种任务,如网络请求(用于视频会议的连接和会议数据的传输)、数据分析(用于分析会议参与者的行为或会议效果)等。
在会议系统工程中,Python可以用于多种任务,如网络请求(用于视频会议的连接和会议数据的传输)、数据分析(用于分析会议参与者的行为或会议效果)等。
|
1月前
|
机器学习/深度学习 算法 数据可视化
m基于PSO-LSTM粒子群优化长短记忆网络的电力负荷数据预测算法matlab仿真
在MATLAB 2022a中,应用PSO优化的LSTM模型提升了电力负荷预测效果。优化前预测波动大,优化后预测更稳定。PSO借鉴群体智能,寻找LSTM超参数(如学习率、隐藏层大小)的最优组合,以最小化误差。LSTM通过门控机制处理序列数据。代码显示了模型训练、预测及误差可视化过程。经过优化,模型性能得到改善。
48 6
|
1月前
|
数据采集 存储 数据挖掘
Python网络爬虫实战:抓取并分析网页数据
使用Python的`requests`和`BeautifulSoup`,本文演示了一个简单的网络爬虫,抓取天气网站数据并进行分析。步骤包括发送HTTP请求获取HTML,解析HTML提取温度和湿度信息,以及计算平均温度。注意事项涉及遵守robots.txt、控制请求频率及处理动态内容。此基础爬虫展示了数据自动收集和初步分析的基础流程。【6月更文挑战第14天】
138 9

热门文章

最新文章