【发布时间】:2018-06-02 21:09:37
【问题描述】:
我有 2000 行网球比赛的 df 和 10 列单场比赛的静态数据。所有比赛都按比赛的DAY排序,在ID1中是比赛的获胜者。
我需要的是洗牌我的 df 行(这不是问题,因为它非常简单)并随机更改 ID1->ID2 的位置和所有列中的统计信息,例如列 A_1 -> 列A_2,当发生这种情况时添加一列,例如当列的位置改变时添加“1”,当所有列都在相同位置时添加“0”。
这里是一个例子
DAY ID1 ID2 A_1 A_2 B_1 B_2
1 10 20 4 6 10 2
2 5 4 0 2 5 1
3 23 34 5 10 2 8
4 4 12 6 4 3 1
EXPECTED RESULT
DAY ID1 ID2 A_1 A_2 B_1 B_2 X
2 5 4 0 2 5 1 0
1 20 10 6 4 2 10 1
3 4 12 6 4 3 1 0
4 23 34 5 10 2 8 0
我的第一次尝试是做一个样本,然后从主 df 中减去样本中的行。然后更改 2 个表之一中的每个名称列。
【问题讨论】:
-
当你写
randomly change position of ID1->ID2 and the stats in all the columns时,你的意思是你想以某种概率决定p是否随机打乱每行的列值(就像掷硬币一样,其中一些行保持未打乱,有些被打乱),还是你的意思是你肯定想随机打乱每一行的列值(然后只跟踪哪些行碰巧有打乱使排序保持不变)?