【发布时间】:2021-02-08 02:52:25
【问题描述】:
我有一个形状为(1000,) 的一维 numpy 数组 X。我想在随机(均匀)位置注入 10 个随机(正常)值,从而获得形状为 (1010,) 的 numpy 数组。如何在 numpy 中高效地做到这一点?
【问题讨论】:
标签: python numpy random numpy-ndarray
我有一个形状为(1000,) 的一维 numpy 数组 X。我想在随机(均匀)位置注入 10 个随机(正常)值,从而获得形状为 (1010,) 的 numpy 数组。如何在 numpy 中高效地做到这一点?
【问题讨论】:
标签: python numpy random numpy-ndarray
不确定这是否是最有效的方法,但至少可以。
A = np.arange(1000)
for i in np.random.randint(low = 0, high = 1000, size = 10):
A = np.concatenate((A[:i], [np.random.normal(),], A[i:]))
编辑,检查性能:
def insert_random(A):
for i in np.random.randint(low = 0, high = len(A), size = 10):
A = np.concatenate((A[:i], [np.random.normal(),], A[i:]))
return A
A = np.arange(1000)
%timeit test(A)
83.2 µs ± 2.47 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
所以绝对不是最有效的。 np.insert 似乎是要走的路。
【讨论】:
insert 执行类似于您的concatenate 的操作。但是对于多个点,它使用布尔掩码将旧值放在它们的插槽中,并将新值放在补码中。
这是一个基于掩码的 -
def addrand(a, N):
n = len(a)
m = np.concatenate((np.ones(n, dtype=bool), np.zeros(N, dtype=bool)))
np.random.shuffle(m)
out = np.empty(len(a)+N, dtype=a.dtype)
out[m] = a
out[~m] = np.random.uniform(N)
return out
示例运行 -
In [22]: a = 10+np.random.rand(20)
In [23]: a
Out[23]:
array([10.65458302, 10.18034826, 10.08652451, 10.03342622, 10.63930492,
10.48439184, 10.2859206 , 10.91419282, 10.56905636, 10.01595702,
10.21063965, 10.23080433, 10.90546147, 10.02823502, 10.67987108,
10.00583747, 10.24664158, 10.78030108, 10.33638157, 10.32471524])
In [24]: addrand(a, N=3) # adding 3 rand numbers
Out[24]:
array([10.65458302, 10.18034826, 10.08652451, 10.03342622, 0.79989563,
10.63930492, 10.48439184, 10.2859206 , 10.91419282, 10.56905636,
10.01595702, 0.23873077, 10.21063965, 10.23080433, 10.90546147,
10.02823502, 0.66857723, 10.67987108, 10.00583747, 10.24664158,
10.78030108, 10.33638157, 10.32471524])
时间:
In [71]: a = np.random.rand(1000)
In [72]: %timeit addrand(a, N=10)
37.3 µs ± 273 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)
# @a_guest's soln
In [73]: %timeit np.insert(a, np.random.choice(len(a), size=10), np.random.normal(size=10))
63.3 µs ± 2.18 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
注意:如果您使用的是更大的数组,np.insert 似乎做得更好。
【讨论】:
你可以使用numpy.insert(arr, obj, values, axis=None)。
import numpy as np
a = np.arange(1000)
a = np.insert(a, np.random.randint(low = 1, high = 999, size=10), np.random.normal(loc=0.0, scale=1.0, size=10))
请记住,insert 不会自动更改您的原始数组,但会返回修改后的副本。
【讨论】:
您可以将np.insert 与np.random.choice 一起使用:
n = 10
np.insert(a, np.random.choice(len(a), size=n), np.random.normal(size=n))
【讨论】: