Python提取指定时间、经度与纬度的NC数据-阿里云开发者社区

Python提取指定时间、经度与纬度的NC数据

2024-03-06 300

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【2月更文挑战第15天】本文介绍基于Python语言的netCDF4库，读取.nc格式的数据文件，并提取指定维（时间、经度与纬度）下的变量数据的方法~

本文介绍基于Python语言的netCDF4库，读取.nc格式的数据文件，并提取指定维（时间、经度与纬度）下的变量数据的方法。

我们之前介绍过.nc格式的数据，其是NetCDF（Network Common Data Form）文件的扩展名，是一种常用的科学数据存储格式，多用于存储科学和工程领域的大型数据集。同时，在我们之前的文章Python提取出多个NC文件中的时间信息数据中，就介绍过基于netCDF4库，对一个文件夹下大量.nc格式数据文件的某一维的信息加以提取的方法。而在本文中，我们则是同样基于netCDF4库，读取.nc文件，并提取指定维（Dimensions，也就相当于是自变量）下的变量（Variables，也就相当于是因变量）的具体数值。

首先，我们需要配置一下netCDF4库，具体配置方法大家可以参考文章Python中h5py与netCDF4库在Anaconda的配置方法。

随后，本文所需代码如下。

# -*- coding: utf-8 -*-
"""
Created on Thu Feb 22 21:41:52 2024

@author: fkxxgis
"""

import netCDF4 as nc

nc_path = r"F:\Data_Reflectance_Rec\soil_1\2020_01.nc"
nc_data = nc.Dataset(nc_path)
print(nc_data)
time_value = nc_data.variables["time"][:]
longitude_value = nc_data.variables["lon"][:]
latitude_value = nc_data.variables["lat"][:]

# 第一种需求
time_need = 0
nc_value_1 = nc_data.variables["swvl1"][time_need, : , : ]

# 第二种需求
longitude_need = 106.467
latitude_need = 36.817
longitude_nc = (abs(longitude_value - longitude_need)).argmin()
latitude_nc = (abs(latitude_value - latitude_need)).argmin()
nc_value_2 = nc_data.variables["swvl1"][time_need, latitude_nc, longitude_nc]

其中，我们首先导入netCDF4库，并指定要读取的.nc格式数据文件的路径nc_path；随后，使用nc.Dataset()打开这一文件，并将返回的Dataset对象存储在nc_data变量中；紧接着，通过print()打印nc_data，这将显示要读取的.nc格式数据文件的基本信息，如变量、维、属性等——这里具体打印出来的情况如下图所示。

其中，在上图我们需要重点关注紫色框内的内容。首先，在dimensions中，我们可以看到所有的维；我这里的.nc格式数据是一个表示气象的数据，所以文件中的维依次就是时间、纬度与经度；随后，在variables中，我们可以看到所有的数据变量（这里的数据变量是包含了维、变量与其他参数）——其中我们重点观察数据中的因变量（也就是上图中的swvl1），需要留意一下其后不同维的排序顺序，在后面我们按照维提取变量数据的时候会用到。

回到前述代码的介绍中。通过前面print()打印出来的nc_data信息，我们知道了这个.nc数据的维，此时我们可以将这几个维也打印出来看看。例如，time_value = nc_data.variables["time"][:]就表示将时间这个维打印出来，相当于获取了全部的时间节点。

再接下来，我们即可开始按照维来提取变量。为了方便，我们就以这个.nc文件的时间维中的第一个节点对应的数据（也就是第一景数据）为例来介绍；因此，我们先将time_need设置为0，表示读取第一个时间节点的数据。在这里，我们给出了2种按照维来提取变量的需求。

首先，是第一种需求，也就是time_need = 0这一行代码的下一行。nc_data.variables["swvl1"]表示这个.nc文件中读取名为swvl1的变量的值，而后面的[time_need, :, :]表示选择指定时间维下的所有经度和纬度位置的值。这些值将被存储在nc_value_1变量中，也就是说这个nc_value_1变量相当于就是当前这个.nc文件的第一景数据（时间节点排在第一位的数据）。

其次，是第二种需求。前面我们提取了指定时间维下的所有经度和纬度位置的值，那么现在就更进一步，提取指定时间维度、经度维度以及纬度维度的数据（相当于就是从前面的一景数据变成了一个像元的数据）。首先，我们指定一个处于.nc文件成像范围内的目标经度longitude_need和目标纬度latitude_need，并使用argmin()函数找到目标经、纬度值与文件中经度、纬度的维数据值最接近的索引值——即longitude_nc和latitude_nc。最后，即可使用nc_data.variables["swvl1"][time_need, latitude_nc, longitude_nc]来获取特定时间、经度和纬度位置的值，并将结果存储在nc_value_2变量中。

这里提一句——为什么需要用argmin()函数呢？这个是因为，我们在实际情况中，需要提取指定空间位置的像素时，这个位置的经、纬度数据肯定是随机的；而通过argmin()函数，就可以找到.nc文件里面经度、纬度所对应的维中，与我们实际需要的经、纬度最接近的那个数值所对应的维的下标。例如，上述代码中，我们希望提取实际经度为106.467位置处的数据；而我这里这个.nc文件，其维中的经度的分辨率是0.1，那它自然没有办法非常精确地确定106.467的位置；所以需要通过argmin()函数，找到与106.467最接近的数据106.5，并进一步确定出这个106.5所在的经度维的下标，那么就可以提取出指定的变量了。

如下图所示，我们通过上述第二种需求，提取出来了目标时间、经度与纬度维下的一个像素。

那么这个像素值对不对呢？我们可以在ArcGIS中打开这个.nc文件的第一景数据，找到代码中目标经、纬度（也就是longitude_need和latitude_need所指向的数据）所对应的像元，并查看其像素值；如下图所示。

可以看到，上图在ArcGIS提取出来的像素值，与上上图在Python中提取出来的像素值一致，说明我们的代码无误。

至此，大功告成。

Python提取指定时间、经度与纬度的NC数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Python提取指定时间、经度与纬度的NC数据

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像