【发布时间】:2021-12-15 17:56:15
【问题描述】:
所以我目前正在处理一个数据集,以便我可以训练一个模型来预测入住率。我想按小时分解数据集,因此每 60 分钟聚合一次数据以获得每小时或半小时的平均值,以便在绘图时更容易阅读。我该怎么做?
Date Temperature Humidity Light CO2
1 2015-02-04 17:51:00 1.000000 0.470533 0.275490 0.190933
2 2015-02-04 17:51:59 0.992823 0.470332 0.277754 0.186446
3 2015-02-04 17:53:00 0.992823 0.469326 0.275490 0.186136
4 2015-02-04 17:54:00 0.992823 0.467315 0.275490 0.182887
5 2015-02-04 17:55:00 0.980861 0.467315 0.275490 0.180566
6 2015-02-04 17:55:59 0.980861 0.467315 0.270964 0.178400
7 2015-02-04 17:57:00 0.980861 0.467315 0.270964 0.178813
8 2015-02-04 17:57:59 0.980861 0.467315 0.270964 0.177162
9 2015-02-04 17:58:59 0.980861 0.467315 0.270964 0.171180
10 2015-02-04 18:00:00 0.974880 0.466197 0.270964 0.170354
11 2015-02-04 18:01:00 0.974880 0.465080 0.270964 0.171747
12 2015-02-04 18:02:00 0.980861 0.462845 0.270964 0.172211
13 2015-02-04 18:03:00 0.980861 0.465825 0.270964 0.167569
14 2015-02-04 18:04:00 0.968900 0.465080 0.270964 0.170045
15 2015-02-04 18:04:59 0.956938 0.463962 0.270964 0.169117
16 2015-02-04 18:06:00 0.956938 0.463962 0.270640 0.165713
17 2015-02-04 18:07:00 0.956938 0.467315 0.000000 0.166331
18 2015-02-04 18:08:00 0.943780 0.471338 0.000000 0.168498
19 2015-02-04 18:08:59 0.943780 0.475807 0.000000 0.168498
20 2015-02-04 18:10:00 0.930622 0.475807 0.000000 0.170973
我确定这可能以前已经回答过,但我找不到任何东西...我正在寻找绘制这些数据。
【问题讨论】:
-
专业提示:如果您
print(train.head()),您可以复制和粘贴文本而不是显示屏幕截图,这样我们就可以更轻松地加载数据以获取答案。 -
如果您需要帮助将 DataFrame 的一个小样本格式化为可复制的代码片段,请参阅How to make good reproducible pandas examples。
标签: python pandas plot aggregate mean