【发布时间】:2018-03-23 02:00:38
【问题描述】:
我正在尝试通过计算数据集中每 15 行的平均值来压缩我的数据,方法是这样做:
n<-15
aggregate(df[c("columnC", "ColumnD")],list(rep(1:(nrow(df)%/%n+1),each=n,len=nrow(df))),mean)[-1]
这可行,但问题是我还有 2 个其他列是离散值,显然我不能取离散值的平均值,并且上面的代码删除了其他列,只有 columnC 和 columnD。我怎样才能做到这一点,以便对于任何离散值,我只取第 15 行的值?
例如,如果我有这样的数据:
1 Sunday Evening 16.2 235.84
2 Sunday Evening 23.4 235.29
3 Sunday Evening 29.4 232.79
4 Sunday Evening 24.2 233.89
5 Sunday Evening 24.2 233.66
6 Sunday Evening 24.2 233.38
7 Sunday Evening 24.2 232.99
8 Sunday Evening 25.4 233.21
9 Sunday Evening 26.8 232.37
10 Sunday Night 25.6 231.55
11 Sunday Night 24.4 231.19
12 Sunday Night 24.4 231.63
13 Sunday Night 24.4 231.71
14 Sunday Night 25.2 231.23
15 Sunday Night 25.2 231.23
我想取第三列和第四列的平均值,对于第一列和第二列,我会对“星期日”和“晚上”感到满意,因为这些是第 15 行的值。
【问题讨论】:
-
没关系!我刚刚意识到我可以剪切离散值,每 15 行取离散值,然后将这些列合并在一起!