【发布时间】:2017-04-20 04:45:50
【问题描述】:
我正在尝试清理我的数据,以便只保留在我的第一个采样周期内观察到的重复值。例如,如果我的数据框如下所示:
df <- data.frame(ID = c(1,1,1,2,2,2,3,3,4,4), period = c(1,2,3,1,2,3,2,3,1,3), mass = rnorm(10, 5, 2))
df
ID period mass
1 1 1 3.313674
2 1 2 6.371979
3 1 3 5.449435
4 2 1 4.093022
5 2 2 2.615782
6 2 3 3.622842
7 3 2 4.466666
8 3 3 6.940979
9 4 1 6.226222
10 4 3 4.233397
我想只保留在第 1 期间测量的个人重复的观察结果。我的新数据框将如下所示:
ID period mass
1 1 1 3.313674
2 1 2 6.371979
3 1 3 5.449435
4 2 1 4.093022
5 2 2 2.615782
6 2 3 3.622842
9 4 1 6.226222
10 4 3 4.233397
使用此页面上的建议 (Remove all unique rows) 我曾尝试使用以下命令,但它留下了个人 3 的观察结果(在第 1 期未测量)。
subset(df, duplicated(ID) | duplicated(ID, fromLast=T))
【问题讨论】:
标签: r dataframe duplicates unique subset