【发布时间】:2020-09-07 07:06:21
【问题描述】:
将一个非常大的数据帧 (50GB) 拆分为多个输出(水平)的最佳/最简单方法是什么?
我想过做类似的事情:
stepsize = int(1e8)
for id, i in enumerate(range(0,df.size,stepsize)):
start = i
end = i + stepsize-1 #neglect last row ...
df.ix[start:end].to_csv('/data/bs_'+str(id)+'.csv.out')
但我敢打赌,有更聪明的解决方案吗?
【问题讨论】: