【发布时间】:2020-08-24 11:35:54
【问题描述】:
我有一个简短的问题,涉及重塑我的数据框,其中我有 ID“grouped_by”数据。 我有以下 df 架构(+ 2 个我希望扩大的示例性实例(我总共有 >5000 个)):
id solver scoreA scoreB group size
<chr> <chr> <dbl> <dbl> <chr> <dbl>
1 instance_1 s1 1 0.5 g1 1000
2 instance_1 s2 100 50 g1 1000
...我想要得到的是:
id solver.best scoreA.s1 scoreA.s2 scoreB.s1 scoreB.s2 group size
<chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr> <dbl>
1 instance_1 s1 1 100 0.5 50 g1 1000
感谢您的帮助。 BR
【问题讨论】:
-
如果你有超过 5000 行,并且你想这样做 - 你将有大约 5000 列,这几乎肯定是错误的方法。你想要完成的事情应该有一条替代路线。
-
ID 总是对 2 个实例进行分组......基本上是说我希望两行变平。即从 5000 行到 2500 行
-
你可以算一算,5 x 5000 和 2500 x 5000 有什么区别?
-
我不明白你的意思。我承认通过 tidyverse 技术进行传播可能不会导致首选结果,并且如果没有分组,最终结果将是 2500 x 5000 df。除此之外,我认为将 2 行缩小为 1 行的想法一旦按 ID 分组没有任何致命性......
-
请您分享
dput的目的是我们可以在我们的R环境中复制您的数据(或其中的一部分)并使用它。当您使用不完整的dput(我们无法复制)更新您的帖子时,这与根本不分享一样好。如果您的数据非常大,您只能共享前几行,例如dput(head(df))前 6 行。
标签: r dataframe tidyverse reshape tibble