【问题标题】:Delete rows with identical variables in R [duplicate]删除R中具有相同变量的行[重复]
【发布时间】:2016-07-20 11:15:20
【问题描述】:

我目前正在尝试将数据子集化为较小的大小,但我在编码部分遇到了问题,因为我是编码方面的新手。

我试图在这里删除所有具有相同条目的行。因此,例如,代码应消除第 3 列“var 2”中具有相同变量的所有行。重复函数只会删除带有“0”的第二个条目,但我想删除带有“0”的两个条目。

感谢您的帮助! http://i.stack.imgur.com/esfSB.jpg

【问题讨论】:

  • 请向我们展示预期的输出。
  • 请勿以图片形式发布您的数据,请了解如何提供reproducible example

标签: r


【解决方案1】:

您可以使用 dplyr 库来执行数据操作。它是一个整洁的图书馆,非常有帮助。我想出了以下代码来解决您的问题。假设数据帧存储在一个名为data_frame的变量中,解决方法如下

data_frame <- tbl_df(data_frame) %>%
              group_by(var2) %>%
              filter(n()==1)

我将结果存储在同一个变量中。您可以使用另一个变量名称来保持原始数据框的完整性

【讨论】:

    【解决方案2】:

    这里我们使用表格来查看哪些值是重复的,然后在所有值中搜索不重复的值。

    df = table(data$Var2)
    data[!data$Var2 %in% as.numeric(names(df[df > 1])), ]
    

    【讨论】:

      【解决方案3】:

      我们还可以将duplicated 包含在fromLast=TRUE 中以删除所有重复的行。

      df1[with(df1, !(duplicated(var2)|duplicated(var2, fromLast=TRUE)),]
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2017-03-02
        • 1970-01-01
        • 2017-01-27
        • 2023-03-11
        • 2015-11-30
        • 2020-10-08
        • 1970-01-01
        • 2022-01-21
        相关资源
        最近更新 更多