【发布时间】:2019-09-02 18:34:01
【问题描述】:
我有一个 MMA 比赛数据集。
目前的结构是
Fighter 1, Fighter 2, Winner
x y x
x y x
x y x
x y x
x y x
我的问题是战斗机 1 = 获胜者,因此我的模型将被训练为战斗机 1 总是获胜,这是一个问题。
我需要能够将 Fighter 1 和 Fighter 2 随机交换一半的数据集,以便让获胜者得到平等的代表。
理想情况下我会拥有这个
Fighter 1, Fighter 2, Winner
x y x
y x x
x y y
y x x
x y y
有没有办法在不弄乱行顺序的情况下随机化列??
【问题讨论】:
-
您的数据中只显示了 1 行,它是如何转换为 5 行的?
-
为什么预期输出中的第 3 行 (
Fighter 1 = "x", Fighter 2 = "y", Winner = "y") 在第 5 行重复?重复的第 2 行和第 4 行也是如此。 -
这只是我的数据的一个示例我有 4800 行战斗数据,我在那里编辑了问题
-
@KilianMurphy 嗯?这并没有真正回答这个问题。一行如何扩展为 5 行?为什么重复的行?在我看来,你应该看看
expand.grid(或tidyr::crossing)。 -
x 和 y 只代表战斗机名称,我需要能够从 Fighter 1 和 Figther 2 列中随机交换名称以获得一半的数据集
标签: r neural-network row