【发布时间】:2015-01-13 19:57:23
【问题描述】:
我做错了什么清楚吗?
我正在尝试使用 pandas HDFStore.select start 和 stop 选项,但没有任何区别。
我使用的命令是:
import pandas as pd
hdf = pd.HDFStore(path % 'results')
len(hdf.select('results',start=15,stop=20))
希望获得 4 或 5 的长度,或者不管它被计算在内,但它给了我整个该死的数据帧。
截图如下:
【问题讨论】:
-
这是一个bug,目前在固定商店:github.com/pydata/pandas/issues/8287;欢迎拉取请求。您可以在任何情况下都更加灵活的表格格式存储中使用它。
-
嘿,谢谢杰夫。我仍然有一个问题,我会很感激提示。运行 format='table' 时,我似乎遇到了一个奇怪的错误,我每 90 分钟不能在 SO 上发布一个以上的问题,所以这里有一个截图:dropbox.com/s/lc06nmitdu29vek/…
-
我会说您的文件已损坏,可能会被中断写入(这是这些文件的警告,这些文件非常快,但您一次只能使用 1 个进程/线程写入)。如果您中断操作,它们可能会在将元数据写入文件等时损坏。我很少看到这类事情。删除文件,然后重试。
-
@Jeff 这就是我正在做的事情。我将一堆 csv 加载到数据框中。我将数据帧合并为一个数据帧,包括一些处理。但最后我有一个数据框,是的,有 NaN,但这很好。问题是这个处理需要一些时间,我想将我的结果保存到我将来会查询的 h5 中。此错误是可重现的,但我将重新启动我的虚拟机。我的问题现已发布:stackoverflow.com/questions/26964964/…
标签: python pandas hdf5 pytables