【问题标题】:How to create a DataFrame of random integers with Pandas?如何使用 Pandas 创建随机整数的 DataFrame?
【发布时间】:2015-12-21 12:31:37
【问题描述】:

我知道如果我使用randn

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD'))

给了我我正在寻找的东西,但包含来自正态分布的元素。但是如果我只想要随机整数呢?

randint 通过提供范围来工作,但不像randn 那样提供数组。那么如何使用某个范围之间的随机整数来做到这一点呢?

【问题讨论】:

标签: python pandas dataframe size shapes


【解决方案1】:

现在推荐使用 NumPy 创建随机整数的方法是使用numpy.random.Generator.integers。 (documentation)

import numpy as np
import pandas as pd

rng = np.random.default_rng()
df = pd.DataFrame(rng.integers(0, 100, size=(100, 4)), columns=list('ABCD'))
df
----------------------
      A    B    C    D
 0   58   96   82   24
 1   21    3   35   36
 2   67   79   22   78
 3   81   65   77   94
 4   73    6   70   96
... ...  ...  ...  ...
95   76   32   28   51
96   33   68   54   77
97   76   43   57   43
98   34   64   12   57
99   81   77   32   50
100 rows × 4 columns

【讨论】:

    【解决方案2】:

    numpy.random.randint 接受第三个参数 (size),您可以在其中指定输出数组的大小。您可以使用它来创建您的DataFrame -

    df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
    

    这里 - np.random.randint(0,100,size=(100, 4)) - 创建一个大小为 (100,4) 的输出数组,其中包含 [0,100) 之间的随机整数元素。


    演示 -

    import numpy as np
    import pandas as pd
    df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD'))
    

    产生:

         A   B   C   D
    0   45  88  44  92
    1   62  34   2  86
    2   85  65  11  31
    3   74  43  42  56
    4   90  38  34  93
    5    0  94  45  10
    6   58  23  23  60
    ..  ..  ..  ..  ..
    

    【讨论】:

    • 能否请您制作一个包含导入/没有行号的可复制粘贴样本?
    • 添加到出色的解决方案中。如果您想按顺序命名列而不是一个字母,您应该执行 df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list(['AA' ,'BB','C2','D2']))
    • @mzakaria [...] 已经是一个列表,所以你不需要list([...])
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-07-31
    • 1970-01-01
    • 2015-04-17
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多