【发布时间】:2020-11-19 11:06:48
【问题描述】:
我的计算机上有一个文件夹,其中包含大约 8500 个 .csv 文件,这些文件都是各种股票代码的名称。在每个 .csv 文件中,都有一个“timestamp”和“users_holding”列。我将“时间戳”列设置为日期时间索引,因为该列中的条目包括每天的每小时条目,例如/2019-12-01 01:50、2020-01-01 02:55... 2020- 01-01 01:45 等。这些时间戳中的每一个都有一个对应的整数,表示当时持有的用户数。我想创建一个 for 循环,该循环遍历所有 .csv 文件,并计算从 2020 年 2 月 1 日(2020-02-01)到最后一天,每天最后一次持有所有 .csv 文件的用户总数.csv 文件中的日期。该文件夹每天都会更新,所以我无法确定结束日期。
这是我设置的用于将每个股票代码建立为数据框的 for 循环:
path = 'C:\\Users\\N****\\Desktop\\r******\\t**\\p*********\\'
all_files = glob.glob(path + "/*.csv")
for filename in all_files:
df = pd.read_csv(filename, header = 0, parse_dates = ['timestamp'], index_col='timestamp')
如果有人能告诉我如何编写 for 循环来查找每个日期的最新条目并计算每天的数字,那就太棒了。
谢谢!
【问题讨论】:
标签: python pandas dataframe datetime for-loop