【发布时间】:2016-07-02 16:06:39
【问题描述】:
我见过很多关于将多个 csv 文件导入 pandas 数据框的问题。 我的问题是如何导入多个 csv 文件但忽略目录中的最后一个 csv 文件?我很难找到这个问题的答案。
另外,我们假设 csv 文件名都是不同的,这就是代码文件是“/*.csv”的原因
任何资源也将不胜感激。谢谢!
path =r'C:\DRO\DCL_rawdata_files' # use your path
allFiles = glob.glob(path + "/*.csv")
frame = pd.DataFrame()
list_ = []
for file_ in allFiles:
df = pd.read_csv(file_,index_col=None, header=0)
list_.append(df)
frame = pd.concat(list_)
【问题讨论】:
-
请定义:
the last csv file in your directory -
allFiles[:-1]- 这就是你想要的吗? -
这也是假设您确切知道 last 文件是什么。
-
如果您自己回答以下问题:按
what排序的最后一个(创建时间、文件名、文件大小等)?,那么您会发现我想答案很容易...... -
@MaxU 很好,我没有意识到这一点。如果可能,让我们基于创建时间(如在最近的 csv 文件中)