【发布时间】:2016-01-31 18:41:00
【问题描述】:
我使用 Pandas 通过 SQL 查询(来自 Hive)检索大量数据。我现在有一个大数据框:
market_pings = pandas.read_sql_query(query, engine)
market_pings['event_time'] = pandas.to_datetime(market_pings['event_time'])
我计算了Time Delta 时间段,它们是:如果在这个market_pings DataFrame 内的这些事件的时间线内发生了一些有趣的事情,我只想要那个时间间隔的日志。
要抓取列具有特定值的 DataFrame 行,有一个很酷的技巧:
valuelist = ['value1', 'value2', 'value3']
df = df[~df.column.isin(value_list)]
有没有人知道如何在时间段内执行此操作,以便我从 market_pings 数据帧中获取特定时间的事件而无需直接迭代(逐行)? 我可以建立一个周期列表(1s 精度),例如:
2015-08-03 19:19:47
2015-08-03 19:20:00
但这意味着我的valuelist 变成了一个元组,我必须以某种方式比较日期。
【问题讨论】:
-
喜欢列表中的值,您想要列表中的时间戳,对吗?还是您在寻找其他东西?
-
您希望 DataFrame 中的记录在一个时间间隔内(在开始时间之后和结束时间之前)具有事件时间,还是在给定时间列表内具有事件时间?跨度>
-
完全正确;所以在这种情况下,我希望事件时间在间隔内。 2015-08-03 19:19:47 至 2015-08-03 19:20:00。不是具体值。
标签: python-2.7 date pandas