【发布时间】:2018-12-04 14:25:52
【问题描述】:
我有很多天的 5 分钟间隔气象 df。缺少某些行和日期。索引是日期时间格式。
DateTime Data
2016-01-01 07:00:00 1
2016-01-01 10:30:00 2
2016-01-01 16:55:00 3
2016-03-25 09:25:00 4
2016-03-25 11:30:00 5
2016-03-25 13:35:00 6
2016-03-25 17:40:00 7
2017-11-09 12:00:00 8
2017-11-09 13:05:00 9
2017-11-09 16:10:00 10
2017-11-09 18:15:00 11
2017-11-09 19:20:00 12
2017-11-09 20:25:00 13
我想用 Data_diff 列创建 daily 数据的 new_df。列 Data_diff 应该包含从每天的最后一个数据减去第一个数据的结果。
预期结果是:
DateTime Data_diff
2016-01-01 2
2016-03-25 3
2017-11-09 5
我不知道该怎么做。划过使用
new_df = df.diff()
但是,这种情况并非如此。
编辑:我也尝试以下
new_df = df.resample('D')['Data'].agg(['first','last'])
new_df['Data_diff'] = new_df['first'] - new_df['last']
但结果不正确。
【问题讨论】: