【发布时间】:2018-07-19 16:59:52
【问题描述】:
我有 2 个数据框
df1
ID ID2 NUMBER
1 2 null
df2
ID ID2 NUMBER
1 2 1
1 2 2
1 2 3
因此,当使用 ID 和 ID2 在 df1 和 df2 之间进行合并时,我会得到重复的列,因为 df1 在 df2 中有 3 个匹配项。我想为 df1 分配一个随机数并将其用于合并,这样我总是得到 1 对 1 的合并。 问题是我的数据集相当大,有时我在 df2 中只有 1 行(因此合并工作正常),有时我在 df2 中有 10+ 行。我想使用以下方法为 df1 分配一个数字:
rand(1,len(df1[(df1.ID=1) & (df1.ID2=2]))
【问题讨论】: