【发布时间】:2015-07-31 09:17:15
【问题描述】:
我有一个 50k 行的 pandas 数据框。我正在尝试添加一个新列,它是从 1 到 5 的随机生成的整数。
如果我想要 50k 个随机数,我会使用:
df1['randNumCol'] = random.sample(xrange(50000), len(df1))
但为此我不知道该怎么做。
R 中的旁注,我会这样做:
sample(1:5, 50000, replace = TRUE)
有什么建议吗?
【问题讨论】:
-
在pandas/numpy中有一个直接函数
np.random.randint(low, high, size)。不需要像我们在 R 中那样实际生成范围low:high并从中采样。
标签: python pandas random integer range