【发布时间】:2019-12-26 16:09:33
【问题描述】:
我需要在布尔值数组中存储一些单元格。起初我使用 numpy,但是当数组开始占用大量内存时,我有了一个想法,即在字典中以元组作为键存储非零元素(因为它是可散列类型)。例如:
{(0, 0, 0): True, (1, 2, 3): True}(这是“3D 数组”中的两个单元格,索引分别为 0,0,0 和 1,2,3,但维数是预先未知的,并在我运行算法时定义)。
这很有帮助,因为非零单元格只填充了数组的一小部分。
为了从这个字典中写入和获取值,我需要使用循环:
def fill_cells(indices, area_dict):
for i in indices:
area_dict[tuple(i)] = 1
def get_cells(indices, area_dict):
n = len(indices)
out = np.zeros(n, dtype=np.bool)
for i in range(n):
out[i] = tuple(indices[i]) in area_dict.keys()
return out
现在我需要使用 Numba 加快速度。 Numba 不支持原生 Python 的 dict(),所以我使用了 numba.typed.Dict。 问题是 Numba 在定义函数阶段想知道键的大小,所以我什至无法创建字典(键的长度事先未知,在调用函数时定义):
@njit
def make_dict(n):
out = {(0,)*n:True}
return out
Numba 无法正确推断字典键的类型并返回错误:
Compilation is falling back to object mode WITH looplifting enabled because Function "make_dict" failed type inference due to: Invalid use of Function(<built-in function mul>) with argument(s) of type(s): (tuple(int64 x 1), int64)
如果我在函数中将 n 更改为具体数字,它会起作用。我用这个技巧解决了它:
n = 10
s = '@njit\ndef make_dict():\n\tout = {(0,)*%s:True}\n\treturn out' % n
exec(s)
但我认为这是错误的低效方式。而且我需要将我的 fill_cells 和 get_cells 函数与 @njit 装饰器一起使用,但 Numba 返回相同的错误,因为我试图在此函数中从 numpy 数组创建元组。
我了解 Numba 的基本限制(以及一般的编译),但也许有一些方法可以加快功能,或者,也许您对我的单元存储问题有另一种解决方案?
【问题讨论】:
-
你考虑过稀疏矩阵吗?
-
@Marat 是的,我自己实现了基于键字典的稀疏矩阵(函数 fill_cells 和 get_cells 是此实现的一部分)。我意识到这是稀疏矩阵非常常见的解决方案。问题是我需要加快这个实现。另外,我不需要对其进行矩阵运算,只需存储和获取值,也许它可以扩展可能的解决方案集。
-
像dicts这样的原生数据结构效率很低。 scipy.sparse 提供了 C 实现,它的性能可能会比原生结构高一个数量级。
-
@Marat 是的,我发现 scipy.sparse 比我的解决方案更快,但它只适用于 2D 矩阵。我需要使用任意维度。我没有找到比自己编写并使用 Numba 加快速度更好的解决方案(这是我现在正在尝试做的事情,我遇到了我在问题中描述的问题)。
-
你以前见过gist.github.com/sklam/830fe01343ba95828c3b24c391855c86吗?当我想使用数组作为矩阵的索引时,我遇到了同样的问题。它只需要在顶部稍作调整,因为dicts没有ndim。
标签: python arrays python-3.x dictionary numba