【问题标题】:Select duplicate rows by comapring multiple columns in R [duplicate]通过比较R中的多列来选择重复行[重复]
【发布时间】:2018-08-15 21:29:40
【问题描述】:

我在选择 R 中的重复行时遇到问题。数据名有 14 列和 100 万行。我必须进行行比较,即找出相同的行,这将是重复的。我想通过这种方法得到重复的行。我的数据框就像 Data frame sample

最后两行相同,因此需要将其标记为标志值 1。 我不知道如何开始。

这些代码我都试过了,

df <- unique(data[,1:97]) //this method gives me unique set not number of duplicates.
dim(data[duplicated(data),])[1]  // this method gives me the number of duplicates but not ids.

我需要知道重复的 ID。

我的意图是检查每一行并写下重复行的总数或行号。

【问题讨论】:

  • @dww 我已经提到了这个问题。它可以删除特定的行和列值,但我需要对整行执行此操作。我已经在我的数据样本中链接了。

标签: r comparison rowcount


【解决方案1】:

查看duplicated() 函数。它可用于删除重复的行或反向保留它们

【讨论】:

  • 我在我的集​​合上应用了 duplicated() 函数,但它显示为 false,甚至存在重复行。
猜你喜欢
  • 2019-03-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-02-05
  • 2018-04-10
  • 2011-02-04
  • 2018-11-15
  • 2016-11-26
相关资源
最近更新 更多