【问题标题】:Delete rows with duplicated record in two different columns删除两个不同列中具有重复记录的行
【发布时间】:2014-06-17 08:51:24
【问题描述】:

我想删除列C1C3 中包含相同字符串的行:

我的df 输入:

C1       C2      C3
14-130n  NE03   14-130n
23-401n  NE05   21-130n
43-123n  NE04   43-121n

我的final预期输出:

C1       C2      C3
23-401n  NE05   21-130n
43-123n  NE04   43-121n

我试过final <- df[!(df[,1] = df[,3]),],但没有用。一些想法?干杯!

【问题讨论】:

  • = 不会工作.. 你需要==

标签: r syntax subset


【解决方案1】:

例如:

df[!df$C1==df$C3,]

df:

df <- read.table(text='C1       C2      C3
14-130n  NE03   14-130n
23-401n  NE05   21-130n
43-123n  NE04   43-121n',header=TRUE,stringsAsFactors=FALSE)

如果你有你应该强制转换的因素:

 df[as.character(df$C1)!=as.character(df$C3),]

【讨论】:

    【解决方案2】:

    final &lt;- subset(df, C1!=C3) 会达到目的吗?

    【讨论】:

    • for 循环也可以“达到目的”。问题不仅是“什么”,还有“如何”。请参阅here 以供参考
    猜你喜欢
    • 2013-04-23
    • 2021-08-09
    • 2015-11-03
    • 1970-01-01
    • 1970-01-01
    • 2020-06-05
    • 2019-06-30
    • 1970-01-01
    • 2018-03-14
    相关资源
    最近更新 更多