【问题标题】:How do I add all the duplicate values of a data frame in R? [duplicate]如何在 R 中添加数据框的所有重复值? [复制]
【发布时间】:2020-05-14 13:17:05
【问题描述】:

[!This is how the input looks like []1 我想总结一列中的所有重复项,以便数据框中没有重复的行。

【问题讨论】:

  • 第二张图片显示输入
  • 欢迎来到 SO 和 R!请避免使用图像发布数据示例。如果您想向人们提供您自己的数据,请使用dput(your_df) 分享您的数据结构,以便我们可以轻松测试我们的答案

标签: r dataframe tidyr


【解决方案1】:

我很想测试你的数据,所以请使用dput 提供它。

基于这篇文章 - Remove duplicates and sum values in R 可能类似于

library(plyr)
filtered_df <- ddply(df,~CashierName,summarise,Quantity=sum(Quantity))

另一个选项,dplyr

df <- df %>% group_by(CashierName) %>% summarise(Quantity= sum(Quantity))

【讨论】:

  • 我无法弄清楚如何使用dput 向您发送数据帧。我是 R 和数据分析领域的新手。你能帮帮我吗?在 R 控制台中使用 dput 会产生一些结果,即数据框
  • 确定@PeddintiKartik。为了将来参考,您只需在 R 控制台中运行 dput(your_data),然后复制输出并将其粘贴到此处。粘贴时,最好将其粘贴为代码,而不是文本。为此,您必须在此 ` 符号之间粘贴代码。另请参阅此处 - stackoverflow.com/questions/5963269/…
  • 我在我的 R 控制台中运行了dput(my_data)。实际上数据框有 80000 行。它只是清除屏幕并仅显示数据框的最后一部分。
  • 在这种情况下,您可以先对数据进行子集化,以便仅与 SO 社区共享一小部分。例如,如果您执行subset &lt;- df[1:100,],您将拥有数据的前 100 行。然后你可以分享 dput(subset) 的输出
  • 感谢您提供的信息!
【解决方案2】:

或者在data.table中

library( data..table )
x <- data.table( x )
x[ , .(Quantity= sum( Quantity)), by = "CashierName" ]

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-12-20
    • 1970-01-01
    • 2018-05-05
    • 1970-01-01
    • 1970-01-01
    • 2021-01-11
    • 1970-01-01
    • 2016-07-04
    相关资源
    最近更新 更多