【问题标题】:Select 50 items from list at random从列表中随机选择 50 个项目
【发布时间】:2013-03-19 22:01:11
【问题描述】:

我有一个从文件中读取项目列表的函数。如何从列表中随机选择 50 个项目写入另一个文件?

def randomizer(input, output='random.txt'):
    query = open(input).read().split()
    out_file = open(output, 'w')
    
    random.shuffle(query)
    
    for item in query:
        out_file.write(item + '\n')   

例如,如果总随机化文件是

random_total = ['9', '2', '3', '1', '5', '6', '8', '7', '0', '4']

我想要一个随机的 3 个集合,结果可能是

random = ['9', '2', '3']

如何从我随机化的列表中选择 50 个?

更好的是,如何从原始列表中随机选择 50 个?

【问题讨论】:

    标签: python list select random


    【解决方案1】:

    如果列表是随机排列的,你可以取前 50 个。

    否则,使用

    import random
    random.sample(the_list, 50)
    

    random.sample帮助文字:

    sample(self, population, k) method of random.Random instance
        Chooses k unique random elements from a population sequence.
        
        Returns a new list containing elements from the population while
        leaving the original population unchanged.  The resulting list is
        in selection order so that all sub-slices will also be valid random
        samples.  This allows raffle winners (the sample) to be partitioned
        into grand prize and second place winners (the subslices).
        
        Members of the population need not be hashable or unique.  If the
        population contains repeats, then each occurrence is a possible
        selection in the sample.
        
        To choose a sample in a range of integers, use xrange as an argument.
        This is especially fast and space efficient for sampling from a
        large population:   sample(xrange(10000000), 60)
    

    【讨论】:

    • 我可以让random.sample 也返回它选择的索引吗?
    • 从索引列表 (range(len(list)) 中提取样本,然后从随机索引列表和原始列表中重建样本。
    【解决方案2】:

    我认为random.choice() 是更好的选择。

    import numpy as np
    
    mylist = [13,23,14,52,6,23]
    
    np.random.choice(mylist, 3, replace=False)
    

    函数从列表中返回一个由 3 个随机选择的值组成的数组

    【讨论】:

    • 我认为你需要使用random.choice(mylist, 3, replace=False)。使用 import numpy as npnp.random.choice(mylist, 3, replace=False) 也不会造成混淆
    • 这是有可能重复列表项
    • 不,这不是一个更好的选择,它慢了大约 100 倍
    【解决方案3】:
    1. 我们有 3 个样本(“橙色”、“芒果”、“苹果”)。创建的系列,应包含 7 个元素并从列表中随机选择。

      random.choice
      import random
      
      import numpy as np
      
      fruits = ['orange','mango','apple']
      
      np.random.choice(fruits, 7, replace=True)
      

      输出

      array(['orange', 'mango', 'apple', 'orange', 'orange', 'mango', 'apple'],
            dtype='<U6')
      
    2. 从列表中随机选择(少于 3 个值)

      random.sample
      import random
      
      random.sample(fruits, 3)
      

    【讨论】:

      【解决方案4】:

      选择随机项目的一种简单方法是随机播放然后切片。

      import random
      a = [1,2,3,4,5,6,7,8,9]
      random.shuffle(a)
      print a[:4] # prints 4 random variables
      

      【讨论】:

      • @MonicaHeddneck 为什么随机洗牌和切片会更好?通过随机化选择来选择多个样本是否与随机洗牌然后取一片洗牌样本具有相同的优点?你能解释一下吗?谢谢。
      • 我用它轻松地为机器学习项目创建了一个测试/训练集。使用random.choice(mylist,3) 不会像这样创建两个不相交的集合。
      【解决方案5】:

      假设您的列表有 100 个元素,并且您想随机选择其中的 50 个。以下是要遵循的步骤:

      1. 导入库
      2. 为随机数生成器创建种子,我把它放在了 2
      3. 准备一个随机号码列表
      4. 从数字列表中随机选择

      代码:

      from random import seed
      from random import choice
      
      seed(2)
      numbers = [i for i in range(100)]
      
      print(numbers)
      
      for _ in range(50):
          selection = choice(numbers)
          print(selection)
      

      【讨论】:

        猜你喜欢
        • 2013-03-08
        • 1970-01-01
        • 2012-09-11
        • 2021-11-17
        • 1970-01-01
        • 2011-02-28
        • 2010-09-23
        • 2011-11-14
        • 2021-11-29
        相关资源
        最近更新 更多