【发布时间】:2021-07-18 10:51:28
【问题描述】:
我有一个大数据集,下面给出一个示例。记录1 day 的数据,5-min 间隔为24 hours 为3214 unique ids。
- 如图所示,某些行中缺少
time and date信息。有没有办法为每个unique_id自动填充缺失的日期和时间?每个唯一 id 有 288 个日期时间值(5 分钟 * 12 小时 * 24 小时 =288每天的值,时间间隔增加 5 分钟) - 另外,如何用以前的值填充缺失的
unqiue ids? - 我正在尝试用空单元格填充最后一列
VALUE。
最温和的答案是here,但解决方案仅适用于缺少日期,而不适用于日期和时间。
sample_data.csv
datetime Unique_ID VALUE
28/01/2018 2:05 105714 284
28/01/2018 2:10 105714 292
28/01/2018 2:15 105714 287
28/01/2018 2:20 105714 193
28/01/2018 2:25 105714 2348
28/01/2018 2:30 105714 284
28/01/2018 2:35 105714 286
28/01/2018 2:40 105714 293
28/01/2018 2:45 105714 229
28/01/2018 2:50 105714 2292
28/01/2018 2:55 105714 225
28/01/2018 4:45 105714 185
28/01/2018 4:50 105714 277
28/01/2018 4:55 105714 185
28/01/2018 5:00 105714 2435
28/01/2018 5:05 105714 273
28/01/2018 5:10 105714 2360
28/01/2018 5:15 105714 282
【问题讨论】:
-
你想用什么值来填充“值”列
-
@Devakumarkp。使用空白或空单元格,例如stackoverflow.com/questions/31470551/…
标签: python python-3.x pandas datetime missing-data