【问题标题】:Randomly select from numpy array从 numpy 数组中随机选择
【发布时间】:2017-09-16 08:01:54
【问题描述】:

我有两个相关的 numpy 数组,Xy。我需要从X 中选择n 随机行并将其存储在一个数组中,对应的y 值并将随机选择的点的索引附加到它上面。

我有另一个数组index,它存储了一个我不想采样的索引列表。

我该怎么做?

样本数据:

index = [2,3]
X = np.array([[0.3,0.7],[0.5,0.5] ,[0.2,0.8], [0.1,0.9]])
y = np.array([[0], [1], [0], [1]])

如果这些X 是随机选择的(其中n=2):

randomylSelected = np.array([[0.3,0.7],[0.5,0.5]])

期望的输出是:

index = [0,1,2,3]
randomlySelectedY = [0,1]

我该怎么做?

【问题讨论】:

  • 那么,randomylSelected 是给定的还是要创建的?
  • 通过从X 中随机选择n 行来创建。 @Divakar
  • 您能否说明您的index 在未采样时如何从[2,3] 更改为[0,1]index 的用途是什么?它与其他数组有什么关系?
  • @MSeifert index 包含一个已采样但不应再次采样的项目列表。
  • @scutnex 在这种情况下:感谢您的澄清,但您应该提出一个新问题,而不是以这种基本方式更改问题(在收到答案后)。您能否将您的问题回滚到原始版本并提出一个新问题?

标签: python arrays numpy


【解决方案1】:

您可以使用np.random.choice 创建随机索引:

n = 2  # for 2 random indices
index = np.random.choice(X.shape[0], n, replace=False)  

然后你只需要用结果索引你的数组:

x_random = X[index]
y_random = Y[index]

【讨论】:

    【解决方案2】:

    只是将@MSeifert 的答案包装在一个函数中:

    def random_sample(arr: numpy.array, size: int = 1) -> numpy.array:
        return arr[np.random.choice(len(arr), size=size, replace=False)]
    

    用途:

    randomly_selected_y = random_sample(Y)
    

    【讨论】:

    • 说真的为什么没有这个功能,这是一个如此常见的用例。太烦人了。
    猜你喜欢
    • 2014-05-15
    • 2017-09-16
    • 2021-12-14
    • 2014-04-21
    • 2018-12-14
    • 2021-12-03
    • 1970-01-01
    • 2020-10-27
    • 2018-06-07
    相关资源
    最近更新 更多