【发布时间】:2020-12-29 14:34:22
【问题描述】:
我有一个需要写入文件的 xml 对象。我看到这需要 1 个多小时才能完成 10,000 条记录。我尝试使用df_merge['xml'] = df_merge['xml'].astype(str) 进行转换。仍然花费的时间相似,即超过 1 小时,只是 astype(str) 需要更多时间。因此,无论是哪种情况,完成to_csv 都需要 1 个多小时。
那么,我可以知道如何快速将大型 xml 对象写入文件吗?
10000 个 xml 的大小约为 600 MB。
df_merge.to_csv(settings.OUTPUT_XML, encoding='utf-8', index=False,
columns=['xml'])
后来我尝试使用np.savetxt,这也需要类似的时间。
import numpy as np
np.savetxt('output_xml.txt', df_merge['xml'], encoding='utf-8', fmt="%s")
【问题讨论】:
标签: python-3.x pandas