在 Python 中优化 numpy 数组中元素的索引和检索？答案

【问题标题】：optimizing indexing and retrieval of elements in numpy arrays in Python?在 Python 中优化 numpy 数组中元素的索引和检索？
【发布时间】：2013-04-16 03:22:45
【问题描述】：

我正在尝试优化以下代码，可能通过在 Cython 中重写它：它只需要一个低维但相对较长的 numpy 数组，查看其列中的 0 值，并将它们标记为数组中的 -1 .代码是：

import numpy as np

def get_data():
    data = np.array([[1,5,1]] * 5000 + [[1,0,5]] * 5000 + [[0,0,0]] * 5000)
    return data

def get_cols(K):
    cols = np.array([2] * K)
    return cols

def test_nonzero(data):
    K = len(data)
    result = np.array([1] * K)
    # Index into columns of data
    cols = get_cols(K)
    # Mark zero points with -1
    idx = np.nonzero(data[np.arange(K), cols] == 0)[0]
    result[idx] = -1

import time
t_start = time.time()
data = get_data()
for n in range(5000):
    test_nonzero(data)
t_end = time.time()
print (t_end - t_start)

data 是数据。 cols 是用于查找非零值的数据列数组（为简单起见，我将其设为同一列）。目标是计算一个 numpy 数组 result，其中感兴趣的列非零的每一行的值为 1，感兴趣的对应列为零的行的值为 -1。

在 15,000 行乘 3 列的不太大的数组上运行此函数 5000 次大约需要 20 秒。有没有办法可以加快速度？似乎大部分工作都用于查找非零元素并使用索引检索它们（对nonzero 的调用以及随后对其索引的使用。）这可以优化还是可以做到最好？ Cython 实现如何在这方面加快速度？

【问题讨论】：

非零值是一个很好的尝试（不确定它是否有很大帮助或根本没有帮助）。如果你很绝望并且知道 cols 是有效的，你可以尝试制作一个线性索引。如果 K 在循环中是恒定的，你也不能每次都重做 np.arange ......

标签： python optimization numpy scipy cython

【解决方案1】：

cols = np.array([2] * K)

那会很慢。那是创建一个非常大的 python 列表，然后将其转换为一个 numpy 数组。相反，请执行以下操作：

cols = np.ones(K, int)*2

这样会更快

result = np.array([1] * K)

你应该这样做：

result = np.ones(K, int)

这将直接生成numpy数组。

idx = np.nonzero(data[np.arange(K), cols] == 0)[0]
result[idx] = -1

cols 是一个数组，但你可以只传递一个 2。此外，使用非零值会增加一个额外的步骤。

idx = data[np.arange(K), 2] == 0
result[idx] = -1

应该有同样的效果。

【讨论】：

谢谢，但cols 不是计算的一部分，它只是一个例子。正如我所提到的，cols 并不总是像 2 这样的一个值——我只是为了简单起见。它通常是一个向量将不同的列。所以我认为这些建议不会加快速度
@user248237dfsf，好的，我错过了关于 cols 不真实的部分。然而，numpy.array([2] * K) 真的很慢，这就是为什么现在的代码很慢。如果没有看到你的真实代码，我真的猜不出它为什么会很慢。