【数据预测】综合比对线性拟合与BP算法预测结果

简介: 【数据预测】综合比对线性拟合与BP算法预测结果

一、数据分析


  首先分析面源监测数据,一共有30个降雨日的数据,其中每个降雨日内都有降雨量,以及总氮、氨氮、总磷、COD这四种污染物的监测数据,且降雨数据与污染物数据数量级相差较大。进而根据污染物与降雨的关系,我认为在模拟污染物载荷时,应当考虑构建成降雨量作为自变量,其他四种污染物分别作为因变量的四个单变量函数。


  然后对数据进行标准化处理。但其实此处函数或者神经网络均为单变量,所以标准化的意义并不大。


image.png

二、模型构建


(一)线性拟合


  接着在Excel中对数据进行简单的作图分析,可以发现如下图所示,四组数据都是比较符合于线性分布。所以首先考虑采用线性模型进行拟合,拟合结果如下图所示。可以看到线性模型并不能够很好地拟合降雨量和四种污染载荷之间的关系,解释程度较高且拟合效果较差,因此本文将不采用线性拟合的方式!


image.png


(二)神经网络模拟


  由线性拟合的经验可知,降雨量与四种污染载荷之间的关系并不复杂,因而可以考虑采用较为简单的神经网络进行模拟,本文即采用BP神经网络进行拟合。


  考虑到BP神经网络存在陷入局部极小值的可能性,对拟合过程中易产生不确定性波动,我们可对BP神经网络进行改进:针对输出结果误差进行判定,对符合要求的拟合输出,不符合则淘汰掉,使输出的结果在一定较小范围的误差内。


  在设置BP神经网络的时候,我们对隐含层设置为10层,函数分别为:logsig、purelin、traingdx、learngdm允许训练的最大步数设置为5000,训练目标的最小误差设置为0.00000001,学习率设置为0.0000001。


  本文中采用R2作为评价指标,把R2在0.998与1.002之间的训练网络进行存储(便于下次调用),这里的R2计算公式:


SSR = SUM((真值 - 真值的均值)^2)


SST = SUM((预测值 - 预测值的均值)^2)


R2 = SSR/SST


image.png


三.使用降水量为自变量


3.1 以降水量为自变量模拟总氨量与真实总氨量进行改进BP网络实验图


image.png


3.2以降水量为自变量模拟氨氮量与真实氨氮量进行改进BP网络实验图

image.png


3.3以降水量为自变量模拟总磷量与真实总磷量进行改进BP网络实验图

image.png


3.4以降水量为自变量模拟COD值与真实COD值进行改进BP网络实验图

image.png


总结


  综合线性拟合模型和神经网络模拟的模拟效果来看,使用神经网络模型完全能胜任数据拟合任务,尽管神经网络的输出存在不稳定性,但是我们可以对神经网络输出部分进行限制从而达到在一定很小的误差内波动,从而达到理想值的要求。因此在本文中我们选择使用改进的神经网络进行预测是可以达到实验目的。



附录


源数据:image.png


结果对比数据:image.png

相关文章
|
14天前
|
存储 编解码 负载均衡
数据分片算法
【10月更文挑战第25天】不同的数据分片算法适用于不同的应用场景和数据特点,在实际应用中,需要根据具体的业务需求、数据分布情况、系统性能要求等因素综合考虑,选择合适的数据分片算法,以实现数据的高效存储、查询和处理。
|
14天前
|
存储 缓存 算法
分布式缓存有哪些常用的数据分片算法?
【10月更文挑战第25天】在实际应用中,需要根据具体的业务需求、数据特征以及系统的可扩展性要求等因素综合考虑,选择合适的数据分片算法,以实现分布式缓存的高效运行和数据的合理分布。
|
27天前
|
机器学习/深度学习 人工智能 算法
"拥抱AI规模化浪潮:从数据到算法,解锁未来无限可能,你准备好迎接这场技术革命了吗?"
【10月更文挑战第14天】本文探讨了AI规模化的重要性和挑战,涵盖数据、算法、算力和应用场景等方面。通过使用Python和TensorFlow的示例代码,展示了如何训练并应用一个基本的AI模型进行图像分类,强调了AI规模化在各行业的广泛应用前景。
29 5
|
2天前
|
算法 C# 索引
C#线性查找算法
C#线性查找算法!
|
18天前
|
存储 JSON 算法
TDengine 检测数据最佳压缩算法工具,助你一键找出最优压缩方案
在使用 TDengine 存储时序数据时,压缩数据以节省磁盘空间是至关重要的。TDengine 支持用户根据自身数据特性灵活指定压缩算法,从而实现更高效的存储。然而,如何选择最合适的压缩算法,才能最大限度地降低存储开销?为了解决这一问题,我们特别推出了一个实用工具,帮助用户快速判断并选择最适合其数据特征的压缩算法。
27 0
|
28天前
|
人工智能 算法 前端开发
无界批发零售定义及无界AI算法,打破传统壁垒,累积数据流量
“无界批发与零售”是一种结合了批发与零售的商业模式,通过后端逻辑、数据库设计和前端用户界面实现。该模式支持用户注册、登录、商品管理、订单处理、批发与零售功能,并根据用户行为计算信用等级,确保交易安全与高效。
|
28天前
|
前端开发 算法 JavaScript
无界SaaS模式深度解析:算力算法、链接力、数据确权制度
私域电商的无界SaaS模式涉及后端开发、前端开发、数据库设计、API接口、区块链技术、支付和身份验证系统等多个技术领域。本文通过简化框架和示例代码,指导如何将核心功能转化为技术实现,涵盖用户管理、企业店铺管理、数据流量管理等关键环节。
|
1月前
|
机器学习/深度学习 算法 数据处理
EM算法对人脸数据降维(机器学习作业06)
本文介绍了使用EM算法对人脸数据进行降维的机器学习作业。首先通过加载ORL人脸数据库,然后分别应用SVD_PCA、MLE_PCA及EM_PCA三种方法实现数据降维,并输出降维后的数据形状。此作业展示了不同PCA变种在人脸数据处理中的应用效果。
31 0
|
22天前
|
算法 安全 数据安全/隐私保护
基于game-based算法的动态频谱访问matlab仿真
本算法展示了在认知无线电网络中,通过游戏理论优化动态频谱访问,提高频谱利用率和物理层安全性。程序运行效果包括负载因子、传输功率、信噪比对用户效用和保密率的影响分析。软件版本:Matlab 2022a。完整代码包含详细中文注释和操作视频。
|
7天前
|
算法 数据挖掘 数据安全/隐私保护
基于FCM模糊聚类算法的图像分割matlab仿真
本项目展示了基于模糊C均值(FCM)算法的图像分割技术。算法运行效果良好,无水印。使用MATLAB 2022a开发,提供完整代码及中文注释,附带操作步骤视频。FCM算法通过隶属度矩阵和聚类中心矩阵实现图像分割,适用于灰度和彩色图像,广泛应用于医学影像、遥感图像等领域。