【发布时间】:2018-10-28 13:38:32
【问题描述】:
我有 2 年的每日销售数据,分为月度文件。
我有多个文件夹,每个文件夹包含多个 csv。 我想在 Python 中使用 pandas 阅读它。
我尝试了 1 个文件夹
path =r'C:\DRO\DCL_rawdata_files' # use your path
allFiles = glob.glob(path + "/*.csv")
frame = pd.DataFrame()
list_ = []
for file_ in allFiles:
df = pd.read_csv(file_,index_col=None, header=0)
list_.append(df)
frame = pd.concat(list_)
但如前所述,这适用于 1 个文件夹,同样我已经为 100 个文件夹运行了 100 次相同的代码块。
他们是否有某种方法可以使用 reduce 它为每个文件夹一次又一次地运行?
【问题讨论】:
-
您的问题可能是因为文件仍处于压缩状态。在这种情况下,我可能会先尝试整理您的数据,然后再将其导入 pandas。
-
您能否提供完整的追溯和最少的数据来重现您的问题?
-
@Alex 我不能他们是数百个,读入 python 的原因也是为了清理它。
-
@Shubham。因此“最少的数据”。解压缩一个文件,然后创建一个包含几个已编辑的 CSV 文件和几行数据的 zip。如果您不想共享数据,请伪造数据。
标签: python-3.x pandas csv