【问题标题】:How to iterate through a time frame?如何遍历时间范围?
【发布时间】:2021-04-08 23:47:45
【问题描述】:

好的,我有一些来自 csv 文件的标准普尔 500 分钟数据。我正在寻找基于时间的时间戳迭代。到目前为止,代码如下所示:

import datetime as dt
import pandas as pd
d = pd.read_csv('/Volumes/Seagate Portable/usindex_2020_all_tickers_awvbxk9/SPX_2020_2020.txt')
d.columns = ['Dates', 'Open', 'High', 'Low', 'Close']
d.Dates = pd.to_datetime(d.Dates)
d = d[(d.Dates.dt.time == dt.time(9, 30)) | (d.Dates.dt.time == dt.time(16, 0))].copy()
d.drop(['High', 'Low'], axis=1, inplace=True)
d.index = range(len(d.Open))

for i in d.index:
    if dt.time(16, 0) in d.Dates[i]:
        d['Open'][i] == np.NaN

导入的 csv 如下所示:

    Date               Open Close
0   2020-01-02 16:00:00 3258.14 3257.98
1   2020-01-03 09:30:00 3226.36 3225.79
2   2020-01-03 16:00:00 3234.35 3234.57
3   2020-01-06 09:30:00 3217.55 3215.01
4   2020-01-06 16:00:00 3246.23 3246.28
5   2020-01-07 09:30:00 3241.86 3238.09
6   2020-01-07 16:00:00 3237.13 3237.18
7   2020-01-08 09:30:00 3238.59 3236.82
8   2020-01-08 16:00:00 3253.21 3253.06
9   2020-01-09 09:30:00 3266.03 3270.29
10  2020-01-09 16:00:00 3274.74 3274.66
11  2020-01-10 09:30:00 3281.81 3281.20
12  2020-01-10 16:00:00 3265.39 3265.34
13  2020-01-13 09:30:00 3271.13 3273.28
14  2020-01-13 16:00:00 3287.98 3288.05
15  2020-01-14 09:30:00 3285.35 3285.09
16  2020-01-14 16:00:00 3282.93 3282.89
17  2020-01-15 09:30:00 3282.27 3281.75
18  2020-01-15 16:00:00 3289.76 3289.40
19  2020-01-16 09:30:00 3302.97 3304.34

我得到的错误是TypeError: argument of type 'Timestamp' is not iterable 我要做的是在 16:00:00 NaN 值处填充所有 Open 值,然后在该时间保留 Close valyes。我可以使用相同的 for 循环遍历时间戳吗?或者是否有另一种可能的方法来对此进行排序并填写相应的 NaN 值?谢谢!

【问题讨论】:

    标签: python pandas datetime indexing time


    【解决方案1】:

    in 用于测试集合中的成员资格或查找字符串中的子字符串。您不能使用它来测试时间戳中的时间。

    如果你想使用for 循环:

    for i in d.index:
        if d.loc[i, 'Date'].time() == dt.time(16,0):
            d.loc[i, 'Open'] == np.NaN
    

    但使用矢量化函数总是更好:

    d['Open'] = d['Open'].mask(d['Dates'].dt.time == dt.time(16, 0))
    

    【讨论】:

      【解决方案2】:
      for i in d.index:
          if dt.time(16, 0) == d.Dates[i]:
              d['Open'].loc[i] = np.nan
      
      or
      
      for i in d.index:
          if dt.time(16, 0) is d.Dates[i]:
              d['Open'].loc[i] = np.nan
      

      【讨论】:

        猜你喜欢
        • 2012-02-21
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2020-05-14
        • 2017-10-31
        • 2018-04-07
        • 2017-03-26
        • 1970-01-01
        相关资源
        最近更新 更多