【发布时间】:2021-07-23 22:29:30
【问题描述】:
我在包含大量 csv 文件 (500+) 的目录中有一个文件夹。我只需要在某个日期之后修改日期的 csv 文件。最终我会将这些文件 pd.concat 到一个单独的 pandas 数据帧中。
了解相关文件的最快方法是什么?
我目前的解决方案是这样的:
## get list of files
list_of_files = glob.glob(Path + '*.csv')
## transform to datataframe
df_files = pd.DataFrame(list_of_files, columns = ['files'])
## Calculate modification time (SLOW)
df_files['Modification_Time'] = df_files['files'].apply(lambda x: datetime.date.fromtimestamp(os.path.getmtime(x)))
## Eventually filter based on Modification date and pd.concat relevant files (code not relevant for the question)
我的解决方案相当慢,我想知道是否有更快的解决方案?
【问题讨论】: