【发布时间】:2021-07-03 21:30:10
【问题描述】:
R 初学者在这里。我目前有一个数据库,其中包含超过 33 个变量,涵盖 10000 多种动物,但我遇到了一些麻烦。
总结一下,我的数据如下所示:
species1 species2 info1 info2
Parrot Parrot 3 NA
NA Parrot NA 7
Osprey NA NA 89
Sparrow Sparrow NA 19
Sparrow NA 27 NA
NA Duck 69 16
我在这里尝试做的是折叠或合并在物种列上有重复的行,同时保留那些具有 NA 的行。像这样的:
species1 species2 info1 info2
Parrot Parrot 3 7
Osprey NA NA 89
Sparrow Sparrow 27 19
NA Duck 69 16
我尝试过使用group_by,但除了它仅按一个变量分组这一事实之外,我不确定它是否正确。我有 5 个其他物种行,它们也可能有重复,我应该对每个都使用这个吗?
data %>%
group_by(species1) %>%
summarise_each(funs(max))
对不起,如果这太明显了,我只是一个新手! 保护你!! :)
【问题讨论】: