【发布时间】:2018-11-09 09:32:40
【问题描述】:
我正在从 Excel 导入到 R,而不是重复和 Excel 的行号(索引)。如果我在设置索引之前执行 unique(),则数据框中的行位置将与 Excel 文件不对应。如果我在 Index 之后执行 unique(),它也会考虑 Index 列,并且不会有任何重复。
这个:
Index a b c
1 12 12 14
2 12 12 14
3 11 12 13
到这里:
Index a b c
1 12 12 14
3 11 12 13
代码:
library(openxlsx)
library(tidyverse)
dati <- data.table(read.xlsx("\\\\192.168.x.x\\file.xlsx", detectDates = TRUE))
#Index row
dati <- tibble::rowid_to_column(dati, "Index")
(如果是重复的问题,我很抱歉,我在高处和低处搜索了几天,没有找到任何东西。我觉得这是一个非常简单的解决方案,在不同的关键字下)
【问题讨论】:
-
试试
i <- duplicated(df[-1]); df[!i, ]。也许相反的方式更具可读性,否定duplicated,而不是子集时的索引i。