如何在 R 中添加数据框的所有重复值？ [复制]答案

【问题标题】：How do I add all the duplicate values of a data frame in R? [duplicate]如何在 R 中添加数据框的所有重复值？ [复制]
【发布时间】：2020-05-14 13:17:05
【问题描述】：

[!This is how the input looks like []1 我想总结一列中的所有重复项，以便数据框中没有重复的行。

【问题讨论】：

第二张图片显示输入
欢迎来到 SO 和 R！请避免使用图像发布数据示例。如果您想向人们提供您自己的数据，请使用dput(your_df) 分享您的数据结构，以便我们可以轻松测试我们的答案

【解决方案1】：

我很想测试你的数据，所以请使用dput 提供它。

library(plyr)
filtered_df <- ddply(df,~CashierName,summarise,Quantity=sum(Quantity))

另一个选项，dplyr

df <- df %>% group_by(CashierName) %>% summarise(Quantity= sum(Quantity))

【讨论】：

我无法弄清楚如何使用dput 向您发送数据帧。我是 R 和数据分析领域的新手。你能帮帮我吗？在 R 控制台中使用 dput 会产生一些结果，即数据框
确定@PeddintiKartik。为了将来参考，您只需在 R 控制台中运行 dput(your_data)，然后复制输出并将其粘贴到此处。粘贴时，最好将其粘贴为代码，而不是文本。为此，您必须在此 ` 符号之间粘贴代码。另请参阅此处 - stackoverflow.com/questions/5963269/…
我在我的 R 控制台中运行了dput(my_data)。实际上数据框有 80000 行。它只是清除屏幕并仅显示数据框的最后一部分。
在这种情况下，您可以先对数据进行子集化，以便仅与 SO 社区共享一小部分。例如，如果您执行subset <- df[1:100,]，您将拥有数据的前 100 行。然后你可以分享 dput(subset) 的输出
感谢您提供的信息！

【解决方案2】：

或者在data.table中

library( data..table )
x <- data.table( x )
x[ , .(Quantity= sum( Quantity)), by = "CashierName" ]

【讨论】：