使用Python读写netCDF4文件,截取指定经纬度范围内的数据生成新的nc文件

Python 使用netCDF4读写nc文件以及截取nc文件经纬度范围内的数据

简单介绍nc文件的读写操作,以及实现输入nc文件和坐标范围,输出一个新的nc文件的功能

环境

python3.8.13
netcdf4 1.5.7 py38h3de5c98_1
numpy 1.23.1 py38h7a0a035_0

读写nc文件代码

导入netCDF4和np包

import netCDF4 as nc
import numpy as np

读取nc文件

# 打开文件
dataset = nc.Dataset(r'H:\test.nc')
# 维度
print('1. Dimensions: ',dataset.dimensions)
# 变量
print('2. Variables: ',dataset.variables.keys())
# 全局属性 ncattrs获取name getncattr获取value
print('3. Global attribute\'s names: ',
      dataset.ncattrs(),
      '\n4. Global attribute\'s values: ',
      [dataset.getncattr(i) for i in dataset.ncattrs()])
# 以下为输出结果,有三个维度,分别是'depth','lat','lon',十三个变量'depth', 'lat', 'lon', 'time', 'tau', 'water_u', 'water_u_bottom', 'water_v', 'water_v_bottom', 'water_temp', 'water_temp_bottom', 'salinity', 'salinity_bottom', 'surf_el'
#1. Dimensions:  {'depth': <class 'netCDF4._netCDF4.Dimension'>: name = 'depth', size = 40, 'lat': <class 'netCDF4._netCDF4.Dimension'>: name = 'lat', size = 1501, 'lon': <class 'netCDF4._netCDF4.Dimension'>: name = 'lon', size = 1191}
#2. Variables:  dict_keys(['depth', 'lat', 'lon', 'time', 'tau', 'water_u', 'water_u_bottom', 'water_v', 'water_v_bottom', 'water_temp', 'water_temp_bottom', 'salinity', 'salinity_bottom', 'surf_el'])
#3. Global attribute's names:  ['classification_level', 'distribution_statement', 'downgrade_date', 'classification_authority', 'institution', 'source', 'history', 'field_type', 'Conventions'] 
#4. Global attribute's values:  ['UNCLASSIFIED', 'Approved for public release. Distribution unlimited.', 'not applicable', 'not applicable', 'Naval Oceanographic Office', 'HYCOM archive file', 'archv2ncdf3z', 'instantaneous', 'CF-1.6 NAVO_netcdf_v1.1']

访问变量

单个变量

water_temp = dataset.variables['water_temp'][:]
print(water_temp.shape)
# 输出
#(40, 1501, 1191)

所有变量

# 访问所有变量
for name in dataset.variables.keys():
    data = dataset.variables[name][:]
    print(data.shape)
# 输出
#(40,)
#(1501,)
#(1191,)
#()
#()
#(40, 1501, 1191)
#(1501, 1191)
#(40, 1501, 1191)
#(1501, 1191)
#(40, 1501, 1191)
#(1501, 1191)
#(40, 1501, 1191)
#(1501, 1191)
#(1501, 1191)

访问变量的属性

for name in dataset.variables.keys():
	# 根据名称获取变量
    var = dataset.variables[name]
    for attr in var.ncattrs():
    	# 属性名,属性值
        print(attr,var.getncattr(attr))
# 结果太长就不列出来了

最后关闭文件

dataset.close()

写入nc文件

# 创建一个新的数据集
newdataset = nc.Dataset(r'H:\testout.nc','w')
# 创建维度 维度名,维度长度(默认None)
newdataset.createDimension('lat',10)
newdataset.createDimension('lon',10)
# 创建变量 变量名,数据类型(numpy中的数据类型),维度(如果不给维度,则变量是标量)
lat = newdataset.createVariable('lat',np.float32,('lat'))
lon = newdataset.createVariable('lon',np.float32,('lon'))
water_temp = newdataset.createVariable('water_temp',np.float32,('lat','lon'))
# 给变量赋值
lat[:] = np.arange(10)
lon[:] = np.arange(10)
water_temp[:] = np.arange(10 * 10).reshape(10,10)
newdataset.close()

保存的结果

截取目标区域的数据生成新的nc文件

导入包

import netCDF4 as nc
import numpy as np

打开已有的nc文件,并且读取出全局属性,变量名称,维度信息

filename = r'H:\test.nc'
dataset = nc.Dataset(filename)
# 定义需要的经纬度范围
extent = [18.,27.,121.,135.]
# 全局属性存入global_attrs_dict中
global_attrs = dataset.ncattrs()
global_attrs_dict = {}
for attr in global_attrs:
    print(attr,dataset.getncattr(attr))
    global_attrs_dict[attr] = dataset.getncattr(attr)
# 根据经纬度大小,获取索引范围x1,x2,y1,y2
old_lat = dataset.variables['lat'][:]
old_lon = dataset.variables['lon'][:]
x1 = np.searchsorted(old_lat,extent[0]) + 1
x2 = np.searchsorted(old_lat,extent[1])
y1 = np.searchsorted(old_lon,extent[2]) + 1
y2 = np.searchsorted(old_lon,extent[3])
# 新的经纬度
new_lat = old_lat[x1:x2]
new_lon = old_lon[y1:y2]
# 获取维度信息
dims = dataset.dimensions
# 获取变量名列表
variables_list = list(dataset.variables.keys())

新建nc文件,写入维度,全局属性,变量属性以及数据

# 新建一个nc文件
newfilename = r'H:\output.nc'
newdataset = nc.Dataset(newfilename,'w')
# 创建维度
for item in dims.items():
    size = item[1].size
    if item[1].name == 'lat':
        size = len(new_lat)
    if item[1].name == 'lon':
        size = len(new_lon)
    newdataset.createDimension(item[1].name, size)
# 设置新nc文件的全局属性
newdataset.setncatts(global_attrs_dict)
# 写入裁剪后的数据
for varname in variables_list:
    print('current variable: %s' % varname)
    var = dataset.variables[varname]
    # 创建变量
    newdataset.createVariable(varname,var.dtype,var.dimensions)
    # 获取变量属性
    var_attr_dict = {}
    for attr in var.ncattrs():
        var_attr_dict[attr] = var.getncattr(attr)
    newvar = newdataset.variables[varname]
    # 写入变量属性
    newvar.setncatts(var_attr_dict)
    # 获取维度信息
    dims_name_list = list(newvar.dimensions)
    # 若有经度或维度,则需要进行截取
    if 'lon' in dims_name_list or 'lat' in dims_name_list:
    	# 1维数据
        if len(dims_name_list) == 1:
            if 'lon' in dims_name_list:
                newvar[:] = var[:][y1:y2]
            elif 'lat' in dims_name_list:
                newvar[:] = var[:][x1:x2]
        # 2维数据
        elif len(dims_name_list) == 2:
            newvar[:] = var[:][x1:x2,y1:y2]
        # 3维数据
        elif len(dims_name_list) == 3:
            newvar[:] = var[:][:,x1:x2,y1:y2]
        else:
        	# 数据中只有三维及以下数据,因此不处理超过三维的数据
            raise ValueError('variable %s\'s dimension > 3.' %varname)       
    # 无经纬度,不需要截取数据
    else:
        newvar[:] = var[:]
# 关闭文件
newdataset.close()
dataset.close()

参考
netCDF4 API 文档

物联沃分享整理
物联沃-IOTWORD物联网 » 使用Python读写netCDF4文件,截取指定经纬度范围内的数据生成新的nc文件

发表评论