【发布时间】:2014-07-16 08:15:53
【问题描述】:
我正在尝试将具有两列(重复的 date_time 序列和单列数值)的长文本文件重塑为具有 date_time 单个索引和多列数据的 Pandas 数据框。实际文件是 100 组 82 年的每日降雨数据(来自随机发生器),大约 300 万行。我想针对 82 x 365(366 闰年)日期时间索引有 100 列降雨数据。为了简化练习,我在下面提供一个示例(代表闰年的四行序列):
2014/01/01 1
2014/01/02 2
2014/01/03 3
2014/01/01 4
2014/01/02 5
2014/01/03 6
2014/01/04 7
2014/01/01 8
2014/01/02 9
2014/01/03 10
所需的输出类似于:
0 1 2
2014/01/01 1 4 8
2014/01/02 2 5 9
2014/01/03 3 6 10
2014/01/04 nan 7 nan
这看起来非常简单,但它让我打败了。我尝试将原始系列转换为数据框,然后使用以下内容,但 Pandas 似乎不喜欢单列:
df.pivot()
【问题讨论】:
-
每套尺寸一样吗?还是开始日期总是一样的?
标签: python python-3.x pandas pivot