【发布时间】:2015-05-06 22:45:31
【问题描述】:
以下是我拥有的数据示例。
date time size filename day.of.week
1 2015-01-16 5:36:12 1577 01162015053400.xml Friday
2 2015-01-16 5:38:09 2900 01162015053600.xml Friday
3 2015-01-16 5:40:09 3130 01162015053800.xml Friday
我想做的是总结每个小时的文件大小。
我想要一个如下所示的结果数据表:
date hour size
2015-01-16 5 7607
2015-01-16 6 10000
以此类推。
但我似乎无法获得所需的输出。
我尝试过ddply和aggregation,但我总结了一整天,我不知道如何在时间列中按小时分解。
我有好几天的数据。因此,它不仅限于那一天。从那天开始,几乎每天都到昨天。
谢谢!
【问题讨论】:
-
要么a)你use a compound group_by expression(在这种情况下我推荐dplyr)要么b)你convert the separate, date+time fields to a datetime object。无论哪种方式,这都是重复的。一旦你明确了你喜欢哪个,这应该作为重复关闭。我的推荐是带有复合 group_by 表达式的 dplyr,它既高效又干净。
标签: r aggregate compound-key