【发布时间】:2026-01-22 11:35:02
【问题描述】:
python 中的 xarray 包似乎使用“延迟加载”来指向磁盘上的结构化数据(例如 netCDF、HDF5),然后 loads the data into memory 仅在“必要时”使用。如何检查交互式 Python 会话或 Python 脚本中的给定 Dataset 或 DataArray 对象是否实际“加载”?
理想情况下,像
import xarray as xr
dataset = xr.open_dataset('data.nc')
dataset.is_loaded() # is it loaded into memory?
不确定这是否是一个有意义的问题,但希望能够安全、自信地控制大型数据集的这种行为,以免不必要地读取整个文件。
【问题讨论】:
-
我实际上认为目前在 xarray 中使用公共 API 是不可能的。 @shoyer 会有一个明确的答案。
标签: python python-3.x memory ipython python-xarray