【发布时间】:2015-07-20 13:24:16
【问题描述】:
假设我已从 SQL 或 CSV(不是在 Python 中创建)加载时间序列数据,索引将是:
DatetimeIndex(['2015-03-02 00:00:00', '2015-03-02 01:00:00',
'2015-03-02 02:00:00', '2015-03-02 03:00:00',
'2015-03-02 04:00:00', '2015-03-02 05:00:00',
'2015-03-02 06:00:00', '2015-03-02 07:00:00',
'2015-03-02 08:00:00', '2015-03-02 09:00:00',
...
'2015-07-19 14:00:00', '2015-07-19 15:00:00',
'2015-07-19 16:00:00', '2015-07-19 17:00:00',
'2015-07-19 18:00:00', '2015-07-19 19:00:00',
'2015-07-19 20:00:00', '2015-07-19 21:00:00',
'2015-07-19 22:00:00', '2015-07-19 23:00:00'],
dtype='datetime64[ns]', name=u'hour', length=3360, freq=None, tz=None)
如您所见,freq 为无。我想知道如何检测这个系列的频率并将freq 设置为其频率。如果可能的话,我希望这适用于不连续的数据(系列中有很多中断)。
我试图找到两个时间戳之间所有差异的模式,但我不确定如何将其转换为系列可读的格式
【问题讨论】:
-
如果有gap,freq是用最小差的两个时间戳设置的吗?
-
@mdurant 是的,大多数两个时间戳的差异与最小差异相同