【发布时间】:2021-10-16 10:29:22
【问题描述】:
我正在尝试编写一个代码,该代码将在一小时内计算 .csv 文件中的记录数。所以,例如:
data = pd.read_csv('2021-07-30.csv', parse_dates=['time'], infer_datetime_format=True)
datafiltr = data[data.lane == "Lane 4 Op2"]
datafiltr['time'] = pd.to_datetime(datafiltr['time'])
df = datafiltr['time'].groupby(datafiltr.time.dt.to_period("H")).agg('count')
打印:
2021-08-13 13:00 18
2021-08-13 14:00 10
2021-08-13 15:00 2
2021-08-13 16:00 1
2021-08-13 17:00 2
2021-08-13 18:00 4
它工作得很好,但我需要在 12 小时的时间跨度内存储数据。这样的事情将是理想的:
2021-08-13 13:00 18
2021-08-13 14:00 10
2021-08-13 15:00 2
2021-08-13 16:00 1
2021-08-13 17:00 2
2021-08-13 18:00 4
2021-08-13 19:00 0
2021-08-13 20:00 0
...
但我不知道如何解决这个问题,请发送帮助。
【问题讨论】:
标签: python pandas csv matplotlib