【发布时间】:2010-10-25 23:03:22
【问题描述】:
我有一个 Python 应用程序。它有一个 SQLite 数据库,里面充满了关于发生的事情的数据,由网络爬虫从网络上检索。该数据在为它们保留的列中包括时间-日期组,作为 Unix 时间戳。我想检索做某事的组织的名称并计算他们做这些事情的频率,但要每周执行一次(即 604,800 秒),我有数据。
伪代码:
for each 604800-second increment in time:
select count(time), org from table group by org
基本上我要做的是像在时间列上排序的列表一样遍历数据库,步长值为 604800。目的是分析不同组织在总数中的分布如何随时间变化。
如果可能的话,我想避免从数据库中提取所有行并在 Python 中处理它们,因为这似乎 a) 效率低下,并且 b) 考虑到数据在数据库中,这可能毫无意义。
【问题讨论】:
标签: python sql sqlite iteration increment