【发布时间】:2018-12-25 18:47:49
【问题描述】:
我有一个如下所示的数据框:
Date Time Entry Exist
2013-01-07 05:00:00 29.0 12.0
2013-01-07 10:00:00 98.0 83.0
2013-01-07 15:00:00 404.0 131.0
2013-01-07 20:00:00 2340.0 229.0
2013-01-08 05:00:00 3443.0 629.0
2013-01-08 10:00:00 6713.0 1629.0
2013-01-08 15:00:00 9547.0 2965.0
2013-01-08 20:00:00 10440.0 4589.0
我想对其进行转换和规范化,以便它显示一段时间内的每小时消耗量。
DateTime Entry Exist
2013-01-07 00:00:00 2.0 1.0
2013-01-07 01:00:00 9.0 4.0
2013-01-07 02:00:00 16.0 6.0
2013-01-07 03:00:00 23.0 9.0
2013-01-07 04:00:00 26.0 10.0
2013-01-07 05:00:00 29.0 12.0
2013-01-07 06:00:00 37.0 19.0
2013-01-07 07:00:00 56.0 32.0
2013-01-07 08:00:00 62.0 57.0
2013-01-07 09:00:00 77.0 63.0
2013-01-07 10:00:00 98.0 83.0
2013-01-07 11:00:00 104.0 95.0
.......
我想先将日期和时间连接成一列作为DateTime,然后达到上述结果。
python新手,任何帮助将不胜感激。谢谢。
【问题讨论】:
-
从您的示例中,没有信息可以填补缺失的时间。例如2013-01-07 00:00:00怎么知道入口和存在?
-
我不明白您的
Entry和Exist列发生了什么变化 -
我想我不清楚我的初始请求,我为输出提供的示例包含随机连续数。如果您看到 05 和 10 小时对于输入和输出具有相同的 Entry 和 Exist 值。而当我们将 DateTime 拆分为更多间隔时,这些值将是 NaN,因此我需要使用任何方法对其进行插值。 1 到 4 的 Entry 值应在 0 和 29 的范围内,Exist 在 0 和 12 的范围内。为了预测 1 到 4、6 到 9、11 到 14 等的 Entry 和 Exist 值,我需要插值的帮助。
标签: python python-3.x pandas datetime