NetCDF文件是自描述的二進制數(shù)據(jù)格式。所謂自描述就是自帶屬性信息,這和一般的雷達基數(shù)據(jù)格式不同,一般的雷達數(shù)據(jù)也是二進制的,但不是自描述的,而是需要額外的數(shù)據(jù)格式文檔來說明數(shù)據(jù)格式,而NetCDF文件中包含了描述變量和維度的元數(shù)據(jù)信息。通常包含以下三個部分:
維度部分記錄的是每個變量的維度名及長度,而變量包含了維度,屬性(如數(shù)據(jù)單位)信息及變量的值。屬性部分包含了一些額外信息,比如文件創(chuàng)建者等。
很多工具都可以處理NetCDF文件,比如MATLAB,Python,NCL,GrADS,CDO,NCO,Panoply等等。這里主要講一下如何利用MATLAB,Python,NCL處理NetCDF文件。
Python
python中有多個庫提供了處理NetCDF文件的功能,比如專門處理nc數(shù)據(jù)的netCDF4-python,scipy,osgeo,PyNIO(Linux)等。
使用 netCDF4-python處理nc數(shù)據(jù)是非常方便的,而且其提供了非常多的功能,并且正在不斷的完善。關(guān)于netCDF4-python庫的介紹,之前已經(jīng)提到了 netcdf4-python 模塊詳解,還有這里這里使用 Cartopy 和 netCDF4 可視化 WRF 模式數(shù)據(jù)
下面以一個例子來講述一下如何處理nc數(shù)據(jù):
# 加載庫 import netCDF4 as nc
data = nc.Dataset('wrfout_v2_Lambert.nc', 'r')
# 輸出文件中變量 print(data.variables.keys())
# 讀取變量 lon = data.variables['XLONG'] lat = data.variables['XLAT'] sst = data.variables['SST']
## 通過指定索引獲取變量部分數(shù)據(jù) # lon = data.variables['XLONG'][1, :, :] # lat = data.variables['XLAT'][1, :, :] # sst = data.variables['SST'][1, :, :]
scipy 庫中的io模塊同樣提供了 netcdf 文件處理方法,其所使用的外部模塊和 netCDF4-python 使用的相同,都不需要使用 Unidata 提供的 netcdf C庫。
import scipy.io as spio
data = spio.netcdf_file('wrfout_v2_Lambert.nc', 'r') # data = spio.netcdf.netcdf_file('wrfout_v2_Lambert.nc', 'r')
# 輸出文件中變量信息 data.variables.keys() Out[95]: dict_keys(['SFROFF', 'DN', 'SH2O', 'TMN', 'UDROFF', 'RDY', 'ITIMESTEP', 'HGT', 'RDX', 'PSFC', 'W', 'V', 'MU', 'QVAPOR', 'SMOIS', 'CF1', 'MAPFAC_U', 'HFX', 'DNW', 'SINALPHA', 'QFX', 'SNOWC', 'PB', 'CFN1', 'VEGFRA', 'MAPFAC_V', 'EPSTS', 'XLONG', 'F', 'XICE', 'COSALPHA', 'E', 'P_TOP', 'ZNW', 'QRAIN', 'SST', 'TSLB', 'RDNW', 'XLAND', 'RAINC', 'SNOW', 'U', 'FNM', 'LANDMASK', 'MAPFAC_M', 'ZNU', 'ZETATOP', 'PHB', 'SNOWH', 'TH2', 'Q2', 'RDN', 'QCLOUD', 'DZS', 'V10', 'RESM', 'TSK', 'CF3', 'RAINNC', 'XLAT', 'GLW', 'ISLTYP', 'P', 'PH', 'T', 'CANWAT', 'IVGTYP', 'CFN', 'CF2', 'MUB', 'LU_INDEX', 'Times', 'FNP', 'SWDOWN', 'PBLH', 'GRDFLX', 'T2', 'U10', 'LH', 'ZS'])
# 讀取變量數(shù)據(jù),獲取變量數(shù)據(jù)的方式和 netCDF4-python 相同 lon = data.variables['XLONG'] lat = data.variables['XLAT'] sst = data.variables['SST']
具體的應(yīng)用見這里 Basemap系列教程:讀取WRF模式數(shù)據(jù)
# 加載模塊 from osgeo import gdal
# 讀取方式略有不同 # 'NETCDF:'' + filename + '':Varname'
lon = gdal.Open('NETCDF:''+ 'wrfout_v2_Lambert.nc' + '':XLONG') lat = gdal.Open('NETCDF:''+ 'wrfout_v2_Lambert.nc' + '':XLAT') sst = gdal.Open('NETCDF:''+ 'wrfout_v2_Lambert.nc' + '':SST')
但是按照上述方式讀取出變量之外,無法直接用于繪圖和其他處理,因為變量類型和之前的方法輸出的變量類型不同:
type(lon) Out[106]: osgeo.gdal.Dataset
獲取數(shù)據(jù)可以通過以下方式:
# 獲取變量數(shù)據(jù) lon_value = lon.ReadAsArray()
lon_value.shape Out[111]: (13, 60, 73)
type(lon_value) Out[112]: numpy.ndarray
獲取變量數(shù)據(jù)后,得到的數(shù)組同樣是 numpy.ndarray 數(shù)組。
MATLAB
matlab中提供了處理netcdf文件的包,但是只有2011年之后的版本內(nèi)置了改包。
讀取數(shù)據(jù)之前,可以先查看以下文件中包含了哪些信息:
ncinfo('F:\wrfout_v2_Lambert.nc');
數(shù)據(jù)信息為結(jié)構(gòu)體,其中包含了各維度信息,包含的變量及屬性等信息。Format 表示文件格式為 classic netcdf文件。
知道變量信息之后就可以讀取變量了:
lon = ncread('F:\wrfout_v2_Lambert.nc', 'XLONG'); lat = ncread('F:\wrfout_v2_Lambert.nc', 'XLAT'); sst = ncread('F:\wrfout_v2_Lambert.nc', 'SST');
讀取數(shù)據(jù)之后,在變量空間可以查看關(guān)于變量的一些信息,比如維度大小。
NCL
ncl處理netcdf文件的方法同樣非常簡單,這里僅簡單介紹一下:
data = addfile('wrfout_v2_Lambert.nc', 'r')
lon = data->XLONG lat = data->XLAT sst = data->SST
; 當然也可以通過索引獲取部分數(shù)據(jù) lon = data->XLONG(1, :, :) lat = data->XLAT(1, :, :) sst = data->SST(1, :, :)
以上三種方法均可以處理netcdf文件,根據(jù)不同的需要使用不同的方法。此節(jié)僅記錄了怎么讀netcdf文件,關(guān)于如何寫netcdf文件下次再說。
除了上述三種工具之外,CDO和NCO在處理netcdf文件時有時會非常有用,關(guān)于這兩部分的介紹有空再說。
|