【发布时间】:2020-05-14 13:17:05
【问题描述】:
[!This is how the input looks like []1 我想总结一列中的所有重复项,以便数据框中没有重复的行。
【问题讨论】:
-
第二张图片显示输入
-
欢迎来到 SO 和 R!请避免使用图像发布数据示例。如果您想向人们提供您自己的数据,请使用
dput(your_df)分享您的数据结构,以便我们可以轻松测试我们的答案
[!This is how the input looks like []1 我想总结一列中的所有重复项,以便数据框中没有重复的行。
【问题讨论】:
dput(your_df) 分享您的数据结构,以便我们可以轻松测试我们的答案
我很想测试你的数据,所以请使用dput 提供它。
基于这篇文章 - Remove duplicates and sum values in R 可能类似于
library(plyr)
filtered_df <- ddply(df,~CashierName,summarise,Quantity=sum(Quantity))
另一个选项,dplyr
df <- df %>% group_by(CashierName) %>% summarise(Quantity= sum(Quantity))
【讨论】:
dput 向您发送数据帧。我是 R 和数据分析领域的新手。你能帮帮我吗?在 R 控制台中使用 dput 会产生一些结果,即数据框
dput(your_data),然后复制输出并将其粘贴到此处。粘贴时,最好将其粘贴为代码,而不是文本。为此,您必须在此 ` 符号之间粘贴代码。另请参阅此处 - stackoverflow.com/questions/5963269/…
dput(my_data)。实际上数据框有 80000 行。它只是清除屏幕并仅显示数据框的最后一部分。
subset <- df[1:100,],您将拥有数据的前 100 行。然后你可以分享 dput(subset) 的输出
或者在data.table中
library( data..table )
x <- data.table( x )
x[ , .(Quantity= sum( Quantity)), by = "CashierName" ]
【讨论】: