【发布时间】:2019-08-12 01:45:24
【问题描述】:
我有以下格式的数据集。它有 48 列和大约 200000 行。
slot1,slot2,slot3,slot4,slot5,slot6...,slot45,slot46,slot47,slot48
1,2,3,4,5,6,7,......,45,46,47,48
3.5,5.2,2,5.6,...............
我想将此数据集重塑为如下所示,其中 N 小于 48(可能是 24 或 12 等)列标题无关紧要。 当 N = 4
slotNew1,slotNew2,slotNew3,slotNew4
1,2,3,4
5,6,7,8
......
45,46,47,48
3.5,5.2,2,5.6
............
我可以逐行读取,然后拆分每一行并附加到一个新的数据帧。但这是非常低效的。有没有更有效、更快捷的方法来做到这一点?
【问题讨论】:
-
每一行都是一个连接字符串吗?还是已经拆分单元格?
-
已经拆分单元格:) 我没有拆分任何单元格。
-
N总是 ncols 的因素吗? -
嗯,这不是必须的。但我可以假设 iN 是 48 的因数
标签: python pandas dataframe reshape