【发布时间】:2017-02-14 03:17:22
【问题描述】:
我需要根据滚动总和为数据集分配唯一的组名。示例DATA 表应该说明我的问题,并查看RESULT 表以获得所需的结果。
DATA 表有两个Rivers,每一行是沿每个River 的一个采样位置。我需要计算Km_inbetween 的滚动总和,当滚动总和超过 50 时,为这些行分配一个组名。然后,重复该过程,从下一行开始滚动总和。
例如,在RESULTS 表中,Ohio River 的前四行总和大于 50,并分配了Group 1。但是,接下来两行的滚动总和超过 50 并分配了Group 2。请注意,GROUP 名称从 Missouri River 开始。
使用dplyr 的解决方案是首选,但欢迎所有建议。在此先感谢您的时间。
DATA表:
Rivers Km_inbetween
Ohio 6
Ohio 7
Ohio 34
Ohio 17
Ohio 47
Ohio 5
Ohio 5
Ohio 3
Ohio 5
Ohio 19
Ohio 11
Ohio 12
Missouri 11
Missouri 10
Missouri 34
Missouri 19
Missouri 5
Missouri 19
Missouri 19
RESULTS表:
Rivers Km_inbetween Group
Ohio 6 1
Ohio 7 1
Ohio 34 1
Ohio 17 1
Ohio 47 2
Ohio 5 2
Ohio 5 3
Ohio 3 3
Ohio 5 3
Ohio 19 3
Ohio 11 3
Ohio 12 3
Missouri 11 1
Missouri 10 1
Missouri 34 1
Missouri 19 2
Missouri 5 2
Missouri 19 2
Missouri 19 2
【问题讨论】:
-
您能否输入
dput或至少正确格式化您的数据。谢谢! -
对@discipulus 感到抱歉.....我很快就发布了这个。请参阅上面的修改。