【发布时间】:2020-04-23 18:23:56
【问题描述】:
我有一个大数据集 (df)(8M 行,50 列)。我正在尝试构建一个 for 循环来创建一个 excel 文件,其中每个工作表都包含数据集每一列的 value_counts()。
(即在 worksheet('Sheet1') 我写 df.columns[0].value_counts() 和在 worksheet('Sheet2') 我写 df.columns[1].value_counts() 等等)。
这是我尝试过的:
for i in range(3,6): # I am using a small range to test the loop
z = df1[df1.columns[i]].value_counts()
z = z.to_frame().reset_index()
title = str(i)
with pd.ExcelWriter('Pivot part1.xlsx') as writer:
z.to_excel(writer, sheet_name=title)
这会一直覆盖文件,因此我最终得到了一个只有一张纸的 Excel 文件,而不是一个有 4 张纸的 Excel 文件。
我希望我设法清楚地解释了这个问题,如果这个问题是重复的,我深表歉意,但我找不到合适的答案,或者至少找不到一个我能理解的答案。
【问题讨论】: