有文件如下:
观察文件发现这些文件名有一定的重复,重复的地方我们可以用字符串表示,不一样的地方可以用通配符(*)表示。
##拼接文件名
str1='RSS_SMAP_SSS_L2C_r' str2='*'#r26259_ str3='_FNL_V04.0.nc' str4='*'
因为文件中有部分是年月日(20200101)组成,所有这里需要加入一个循环处理。
以后遇到由年月日组成的文件名同样可以处理,同时,由于每一年的每个2月时间会有不同(闰年),所以需要导入一个模块:calendar。具体使用条件可以自己在:bing上搜索:python calendar
import calendar
下面就是对于年月日写循环了
for year in range(2020,2021):#这里只展示2020年 for month in range(1,13):#表示12个月 for day in range(1,calendar.monthrange(year,month)[1]+1):#表示每个月的天数
同时,如果不确定是否成功,可以先用golb.glob 模糊查询一下,导入glob模块:
import glob
加入文件的路径,拼接的文件名
path='G:\\'#文件路径,一般需要两个\,别问为什么,不用可能报错 for year in range(2020,2021): for month in range(1,2): # for day in range(1,calendar.monthrange(year,month)[1]+1): for day in range(1,3): #我的文件放在01号文件夹下面,所以拼接的时候加入了:'%02.0f'%month+'\\' fn='%02.0f'%month+'\\'+str1+str2+'_'+'%04.0f'%year+'%02.0f'%month+'%02.0f'%day+\ 'T'+str4+'_'+str4+str3 f=glob.glob(path+fn) #这里需要绝对路径
查询之后会得到一个list,既你所拥有的所以文件。之后就可以进行其他循环处理啦~~~
举个例子,我这个是nc文件,之后对于每一个nc文件进行循环处理即可:
别忘了导入模块:import netCDF4 as nc
for file in f: f1 =nc.Dataset(file,'r') # print(f1) lat = `f1.variables['cellat'][:].data` lon = f1.variables['cellon'][:].data time = f1.variables['time'][:].data
那就顺便讲一下nc文件的读取方式吧!
读取nc文件的办法很多,我这里使用的是nc.Dataset(file,'r')
file就是文件名,字符串(str)的格式,如 ‘20200101.nc’
你可以将其付给一个变量,并打印出来print(f1)
,查找你要输出的数据。
之后f1.variables['你要的数据名称'][:].data
全部的代码如下:
import calendar import glob import netCDF4 as nc str1='RSS_SMAP_SSS_L2C_r' str2='*' str3='_FNL_V04.0.nc' str4='*' path='G:\\'#文件路径 for year in range(2020,2021): for month in range(1,13): for day in range(1,calendar.monthrange(year,month)[1]+1): fn='%02.0f'%month+'\\'+str1+str2+'_'+'%04.0f'%year+'%02.0f'%month+'%02.0f'%day+\ 'T'+str4+'_'+str4+str3 f=glob.glob(path+fn) for file in f: f1 =nc.Dataset(file,'r') # print(f1) lat = f1.variables['cellat'][:].data lon = f1.variables['cellon'][:].data
一个努力学习python的海洋小白 水平有限,欢迎指正!!! 欢迎评论、收藏。