【发布时间】:2021-02-22 11:56:48
【问题描述】:
假设我有两个数据框,一个包含环境数据 (env.df) 和其他物种出现 (species.df),两者都具有相同的行名。我想根据env.df 中一列(Year)的值对species.df 中的行进行分组,然后分别计算每一年的统计数据。
env.df:
Site Year
A2015 A 2015
A2016 A 2016
A2017 A 2017
B2015 B 2015
B2016 B 2016
B2017 B 2017
species.df:
Species1 Species 2 Species 3
A2015 1 1 1
A2016 0 0 1
A2017 0 0 1
B2015 1 0 1
B2016 1 1 1
B2017 1 1 0
我不想再向species.df 添加任何列,因为我需要使用的统计函数只能处理存在-不存在的按物种样本数据集。我知道如何从每年中单独选择样本——species.df[env.df$Year== '2015',] 等等——但我可以使用每年重复的一行代码来完成。我只能让dplyr group_by 函数在env.df 上工作,并且不知道如何将其扩展到链接的 species.df
非常感谢
【问题讨论】: