【发布时间】:2014-05-07 06:21:25
【问题描述】:
读取列中时间值的 csv 文件,并尽可能高效地获取具有 1 列值和日期时间索引的数据框。我做了一个 read_csv,然后是一个堆栈和下面的函数,但它会消耗更多的时间和内存。
有人有更好的方法吗?
df.apply(lambda row: row['DATE'] + relativedelta( hours = int(row['level_2'][2:])), axis=1)
DATE H01 H02 H03 H04 ...
2014/01/01 1.2 2.4 3.3 4.1
2014/01/02 4.3 2.6 3.2 4.1
得到:
DATE
2014-01-01 00:00:00 1.2
2014-01-01 01:00:00 2.4
2014-01-01 02:00:00 3.3
2014-01-01 03:00:00 4.1
【问题讨论】:
-
有 24 列吗? (即每小时是否有一列?)
-
回答了两种情况,我想知道是否有/应该是更好的方法。