使用重复索引递增 Numpy 数组答案

【问题标题】：Increment Numpy array with repeated indices使用重复索引递增 Numpy 数组
【发布时间】：2011-01-01 12:57:44
【问题描述】：

我有一个 Numpy 数组和一个索引列表，我想将它们的值加一。该列表可能包含重复的索引，我希望增量与每个索引的重复次数成比例。没有重复，命令很简单：

a=np.zeros(6).astype('int')
b=[3,2,5]
a[b]+=1

通过重复，我想出了以下方法。

b=[3,2,5,2]                     # indices to increment by one each replicate
bbins=np.bincount(b)
b.sort()                        # sort b because bincount is sorted
incr=bbins[np.nonzero(bbins)]   # create increment array
bu=np.unique(b)                 # sorted, unique indices (len(bu)=len(incr))
a[bu]+=incr

这是最好的方法吗？假设np.bincount 和np.unique 操作会产生相同的排序顺序是否存在风险？我是否缺少一些简单的 Numpy 操作来解决这个问题？

【问题讨论】：

请注意，numpy.zeros(6).astype('int') 最好写成 numpy.zeros(6, int)。

标签： python indexing numpy

【解决方案1】：

在 numpy >= 1.8 中，还可以使用at 方法的加法'万能函数'（'ufunc'）。作为docs note：

对于加法ufunc，这个方法等价于a[indices] += b，除了对多次索引的元素累加结果。

以你为例：

a = np.zeros(6).astype('int')
b = [3, 2, 5, 2]

……到那时……

np.add.at(a, b, 1)

...将a 保留为...

array([0, 0, 2, 1, 0, 1])

【讨论】：

这个解决方案是最优雅的 AFAIK！
我正在尝试使用矩阵执行此操作，但出现错误：arr = np.array([[1,3,5],[7,9,11]] ); lIndexes = [[0,1],[1,0],[1,2]] np.add.at(arr, lIndexes, 1) 有什么想法吗？
我建议将这个关于多维索引的新问题作为一个单独的问题发布。

【解决方案2】：

如果b 是a 的一个小子范围，可以像这样细化Alok 的答案：

import numpy as np
a = np.zeros( 100000, int )
b = np.array( [99999, 99997, 99999] )

blo, bhi = b.min(), b.max()
bbins = np.bincount( b - blo )
a[blo:bhi+1] += bbins

print a[blo:bhi+1]  # 1 0 2

【讨论】：

【解决方案3】：

做完之后

bbins=np.bincount(b)

为什么不这样做：

a[:len(bbins)] += bbins

（为进一步简化而编辑。）

【讨论】：

当 b 只包含几个大的 bin 数字时，这不会更慢吗？
是的，在这种情况下它会比简单的 Python 循环慢，但仍然比 OP 的代码快。我使用b = [99999, 99997, 99999] 和a = np.zeros(1000, 'int') 进行了快速计时测试。计时是：OP：2.5 ms，我的：495 us，简单循环：84 us。
这很好用。在我的程序中，一个简单的循环通常比较慢。谢谢。
在多维情况下有没有类似的方法来完成这个？