【发布时间】:2021-04-22 19:00:48
【问题描述】:
我知道二维数组的 x 和 y 索引(numpy 索引)。
在documentation 之后,xarray 使用例如Fortran 风格的索引。
所以当我通过例如
ind_x = [1, 2]
ind_y = [3, 4]
我希望索引对 (1,3) 和 (2,4) 有 2 个值,但 xarray 返回一个 2x2 矩阵。
现在我想知道如何用 xarray 实现类似 numpy 的索引?
注意:我想避免将整个数据加载到内存中。所以使用.values api 不是我正在寻找的解决方案的一部分。
【问题讨论】:
-
你能再具体一点吗?如果您不想“将整个数据加载到内存中”,我假设您正在使用基于 dask 的 xarray?
-
据我了解 xarray 正确它只是将 netcdf 的标头加载到内存中。 Dask 用于将函数应用于大型数据集,因为我认为它只处理数据块。
-
我已经更新了我对 dask 用例的回答。当然,性能在很大程度上取决于数据本身的存储方式,以及与之相关的 dask 分块的设置方式。
标签: python numpy python-xarray