【发布时间】:2020-11-02 18:04:52
【问题描述】:
我需要根据两个条件过滤数据集。
这是我的数据集的样子:
df <- data.frame(
id = c(1,2,2,3,3,4,5,5),
district = c(10,10,11,12,12,13,14,15),
value = c(10.2, 10.8, 10.8, 7.5, 9.3, 6, 7.0, 7.0))
> df
id district value
1 1 10 10.2
2 2 10 10.8
3 2 11 10.8
4 3 12 7.5
5 3 12 9.3
6 4 13 6.0
7 5 14 7.0
8 5 15 7.0
我根据ids 复制了行。为了保持所需的行,
Firstids 有复合区但相同value,我需要保留第一行:
Secondids 有多个values,但是来自同一个区,我需要值行的max。
所以所需的过滤数据集是:
> df
id district value
1 1 10 10.2
2 2 10 10.8
3 3 12 9.3
4 4 13 6.0
5 5 14 7.0
到目前为止,我只能找到重复的 ID。
df[duplicated(df$id),]
有人有什么想法吗? 谢谢
【问题讨论】: