python SMAP_level2c nc 文件做线性拟合:y=ax+b

简介: 最近再处理卫星盐度数据时,通过时空匹配以及质量控制之后,需要对所得数据进行拟合分析。进而分析其误差分布、原因等。根据学习,python中自带线性拟合的函数,使用起来较为方便快捷~

最近再处理卫星盐度数据时,通过时空匹配以及质量控制之后,需要对所得数据进行拟合分析。进而分析其误差分布、原因等。


根据学习,python中自带线性拟合的函数,使用起来较为方便快捷~


下面介绍两组实现方式:


一、numpy.linalg.lstsq


具体参数链接为:numpy.linalg.lstsq

总之,这个库的目的是将最小二乘解返回线性矩阵方程

举一个例子,现有两组数据,我们最终想法是通过一些嘈杂的数据点拟合一条线,y = mx + c:


x = np.array([0, 1, 2, 3])
y = np.array([-1, 0.2, 0.9, 2.1])


我们可以将线方程改写为y = Ap,其中A = [[x 1]]和p = [[m],[c]],

使用lstsq求解p


A = np.vstack([x, np.ones(len(x))]).T
#通过上述函数可以得到A:
A
array([[ 0.,  1.],
       [ 1.,  1.],
       [ 2.,  1.],
       [ 3.,  1.]])


m, c = np.linalg.lstsq(A, y, rcond=None)[0]
m, c
(1.0 -0.95) # may vary``


得到我们需要的系数之后,绘制数据和拟合线:


import matplotlib.pyplot as plt
_ = plt.plot(x, y, 'o', label='Original data', markersize=10)
_ = plt.plot(x, m*x + c, 'r', label='Fitted line')
_ = plt.legend()
plt.show()


20210430154825223.png


明白了大致过程之后,对自己的数据进行相应的套用即可(我这里是对所需要的两套盐度数据进行拟合):


import numpy as np
import pandas as pd
filename='G:\\select\\2020prof.csv'
data=pd.read_csv(filename)
smap_sss=data['smap_sss']
argo_sss=data['argo_sss']
x0 = np.linspace(0,50)  
y0=x0
# 创建画板-绘图
plt.rcParams['font.sans-serif']=['SimHei'] 
fig2=plt.figure(figsize=(30,10))#设置一个画板,将其返还给fig
fig2.tight_layout()#使均匀分布
# argo vs smap
ax1 = fig2.add_subplot(1,3,1,)
# ax1.grid()#添加网格线,true
cm = plt.cm.get_cmap('jet',8)#加入色标
cb=ax1.scatter(argo_sss,smap_sss,c=pres,cmap = cm,vmin=0,vmax=4,marker='*',s=10)#绘制散点图
ax1.plot(x0,y0)#绘制一条1:1的曲线
ax1.set_title('SMAP vs Argo',fontsize=30)#设置标题
ax1.set_ylabel('SMAP 盐度(psu)',fontsize=30)
ax1.set_xlabel('Argo 盐度(psu)',fontsize=30)#设置x轴标签
ax1.annotate('Std=0.97', (0.6, 0.2), xycoords='axes fraction', fontsize=25,color="k")#添加文本
ax1.tick_params(labelsize=20)#设置x轴、y轴单位字体大小
#===========拟 合======================================
A1 = np.vstack([argo_sss, np.ones(len(argo_sss))]).T
m1, c1 = np.linalg.lstsq(A1, smap_sss, rcond=None)[0]
ax1.plot(argo_sss, m1*argo_sss + c1, 'r',linestyle=':',linewidth=5)
ax1.set_ylim((25, 40))#将Y轴范围设定在(25, 40)
ax1.set_xlim((25, 40))
ax1.annotate(' Y = 0.45580X + (19.09928)', (0, 0.4), xycoords='axes fraction',\
             fontsize=20,color="k",rotation=28)


20210430155050129.png


怎么样,效果不错吧~


二、调用LinearRegression 函数(普通最小二乘线性回归)


LinearRegression参数说明


sklearn.linear_model.LinearRegression(*, fit_intercept=True, normalize=False, copy_X=True, n_jobs=None, positive=False)

LinearRegression使用系数w =(w1,…,wp)拟合线性模型,以最小化数据集中观察到的目标与通过线性近似预测的目标之间的平方余数.

话不多说,直接上代码,具体的参数传递可以去参数说明中查看~


import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression 
filename='G:\\select\\2020prof.csv'
data=pd.read_csv(filename)
smap_sss=data['smap_sss']
argo_sss=data['argo_sss']
fig=plt.figure(figsize=(8,8))
ax=fig.add_subplot()
x2=argo_sss.reshape((-1, 1))
y2=ref_sss.reshape((-1, 1))
reg = LinearRegression().fit(x2, y2)
r=reg.score(x2, y2)
print("一元回归方程为:  Y = %.5fX + (%.5f)" % (reg.coef_[0][0], reg.intercept_[0]))
cm = plt.cm.get_cmap('jet',8)
cb=ax.scatter(argo_sss,smap_sss,c=pres,cmap = cm,vmin=0,vmax=4,marker='*',s=10)
ax.plot(x2, reg.predict(x2), color='lightskyblue', linewidth=1,linestyle='-')
plt.show()

20210430160237374.png


                           一个努力学习python的海洋小白
                            水平有限,欢迎指正!!!
                            欢迎评论、收藏。


相关文章
|
3月前
|
编译器 Python
如何利用Python批量重命名PDF文件
本文介绍了如何使用Python提取PDF内容并用于文件重命名。通过安装Python环境、PyCharm编译器及Jupyter Notebook,结合tabula库实现PDF数据读取与处理,并提供代码示例与参考文献。
|
3月前
|
编译器 Python
如何利用Python批量重命名文件
本文介绍了如何使用Python和PyCharm对文件进行批量重命名,包括文件名前后互换、按特定字符调整顺序等实用技巧,并提供了完整代码示例。同时推荐了第三方工具Bulk Rename Utility,便于无需编程实现高效重命名。适用于需要处理大量文件命名的场景,提升工作效率。
|
4月前
|
编解码 Prometheus Java
当Python同时操作1000个文件时,为什么你的CPU只用了10%?
本文介绍如何构建一个高效的文件处理系统,解决单线程效率低、多线程易崩溃的矛盾。通过异步队列与多线程池结合,实现任务调度优化,提升I/O密集型操作的性能。
73 4
|
4月前
|
人工智能 索引 Python
[oeasy]python094_使用python控制音符列表_midi_文件制作
本文介绍了如何使用Python控制音符列表制作MIDI文件。首先回顾了列表下标索引(正数和负数)的用法,接着通过`mido`库实现MIDI文件生成。以《两只老虎》为例,详细解析了代码逻辑:定义音高映射、构建旋律列表、创建MIDI文件框架,并将音符插入音轨。还探讨了音符时值与八度扩展的实现方法。最终生成的MIDI文件可通过不同平台播放或编辑。总结中提到,此技术可用于随机生成符合调性的旋律,同时引发对列表其他实际应用的思考。
110 6
|
6月前
|
Python
使用Python实现multipart/form-data文件接收的http服务器
至此,使用Python实现一个可以接收 'multipart/form-data' 文件的HTTP服务器的步骤就讲解完毕了。希望通过我的讲解,你可以更好地理解其中的逻辑,另外,你也可以尝试在实际项目中运用这方面的知识。
270 69
|
3月前
|
数据采集 监控 算法
Python文件与目录比较全攻略:从基础操作到性能优化
文件比较的核心在于数据指纹校验,通过逐字节比对生成唯一标识,确保内容一致性。从标准库的os与filecmp到高性能第三方库如pydiffx,再到分布式与量子加密技术的未来趋势,文件比较广泛应用于数据备份、代码审查与系统监控等领域,是保障数据完整性的关键技术手段。
89 0
|
4月前
|
数据采集 存储 API
Python爬虫结合API接口批量获取PDF文件
Python爬虫结合API接口批量获取PDF文件
|
4月前
|
数据采集 运维 BI
Python 文件操作进阶|使用 shutil 实现高效文件复制
在开发和运维中,处理大量文件是常见需求,如备份配置、归档日志或构建部署包。手动复制粘贴已无法满足高效需求!Python 的 `shutil` 模块提供了强大的文件操作功能,支持单文件复制、目录树迁移及自动化任务构建。本文详解 `shutil.copy()` 基础用法与进阶技巧,如批量复制、自动路径检测、时间戳命名备份等,助你实现高效自动化。结合实战案例(如自动备份系统),让你的代码更专业!学习后,欢迎交流心得,一起精进 Python 技能。关注我,获取更多编程技巧与源码分享!
|
6月前
|
Shell 开发者 Docker
Python文件打包:一站式指南
本文深入探讨Python文件打包的各种方法,从基础的zip和tar工具到高级的setuptools、PyInstaller、cx_Freeze等,涵盖Docker镜像、虚拟环境及自包含可执行文件的打包方式。通过示例代码与详细解析,帮助开发者根据项目需求选择合适的打包方案,提升代码分发与部署效率。内容全面,适合各水平读者学习参考。
459 7
|
7月前
|
存储 算法 文件存储
探秘文件共享服务之哈希表助力 Python 算法实现
在数字化时代,文件共享服务不可或缺。哈希表(散列表)通过键值对存储数据,利用哈希函数将键映射到特定位置,极大提升文件上传、下载和搜索效率。例如,在大型文件共享平台中,文件名等信息作为键,物理地址作为值存入哈希表,用户检索时快速定位文件,减少遍历时间。此外,哈希表还用于文件一致性校验,确保传输文件未被篡改。以Python代码示例展示基于哈希表的文件索引实现,模拟文件共享服务的文件索引构建与检索功能。哈希表及其分布式变体如一致性哈希算法,保障文件均匀分布和负载均衡,持续优化文件共享服务性能。

热门文章

最新文章

推荐镜像

更多