Hierarchical Data Format (HDF)——分层数据格式,通常包含多维数据,许多水文气象相关的数

据格式都是HDF。本文旨在利用python语言实现数据的快速读取,数据来自GLASS FPAR数据。

#%% 导入需要用到的库
from pyhdf.SD import SD, SDC
import pprint
import pandas as pd

#%% 读取HDF信息并提取数据 
HDF_FILR_URL = r"E:\Research_life\DATA\MODIS FPAR\2001\GLASS09G02.V50.A2001057.2021020.hdf"
file = SD(HDF_FILR_URL)
 
print(file.info())

datasets_dic = file.datasets()
 
for idx,sds in enumerate(datasets_dic.keys()):
    print(idx,sds)

sds_obj = file.select('FAPAR') # select sds
 
fPAR = sds_obj.get() # get sds data

print(fPAR)

pprint.pprint(sds_obj.attributes())  # read information

fPAR = pd.DataFrame(fPAR)

## Filtering data
fPAR[fPAR>250] = np.nan

## multi scale_factor
fPAR = fPAR * 0.004

HDF数据的经纬度信息并未记录在数据本身中,需要通过xml文件中读取经纬度起始以及间隔等信息

GitHub - JasperjayC1/read_MODIS_hdf: reading and mapping MODIS hdf documents using Python

参考文献:

python 读取 modis hdf文件_aliceDingYM的博客-CSDN博客

https://en.wikipedia/wiki/Hierarchical_Data_Format

更多推荐

【Python学习】——读取HDF数据