删除R中具有相同变量的行[重复]答案

【问题标题】：Delete rows with identical variables in R [duplicate]删除R中具有相同变量的行[重复]
【发布时间】：2016-07-20 11:15:20
【问题描述】：

我目前正在尝试将数据子集化为较小的大小，但我在编码部分遇到了问题，因为我是编码方面的新手。

我试图在这里删除所有具有相同条目的行。因此，例如，代码应消除第 3 列“var 2”中具有相同变量的所有行。重复函数只会删除带有“0”的第二个条目，但我想删除带有“0”的两个条目。

【问题讨论】：

标签： r

【解决方案1】：

您可以使用 dplyr 库来执行数据操作。它是一个整洁的图书馆，非常有帮助。我想出了以下代码来解决您的问题。假设数据帧存储在一个名为data_frame的变量中，解决方法如下

data_frame <- tbl_df(data_frame) %>%
              group_by(var2) %>%
              filter(n()==1)

我将结果存储在同一个变量中。您可以使用另一个变量名称来保持原始数据框的完整性

【讨论】：

【解决方案2】：

这里我们使用表格来查看哪些值是重复的，然后在所有值中搜索不重复的值。

df = table(data$Var2)
data[!data$Var2 %in% as.numeric(names(df[df > 1])), ]

【讨论】：

【解决方案3】：

我们还可以将duplicated 包含在fromLast=TRUE 中以删除所有重复的行。

df1[with(df1, !(duplicated(var2)|duplicated(var2, fromLast=TRUE)),]

【讨论】：