【问题标题】:HDFStore start stop not workingHDFStore 启动停止不起作用
【发布时间】:2015-01-13 19:57:23
【问题描述】:

我做错了什么清楚吗?

我正在尝试使用 pandas HDFStore.select startstop 选项,但没有任何区别。

我使用的命令是:

import pandas as pd 
hdf = pd.HDFStore(path % 'results')
len(hdf.select('results',start=15,stop=20))

希望获得 4 或 5 的长度,或者不管它被计算在内,但它给了我整个该死的数据帧。

截图如下:

【问题讨论】:

  • 这是一个bug,目前在固定商店:github.com/pydata/pandas/issues/8287;欢迎拉取请求。您可以在任何情况下都更加灵活的表格格式存储中使用它。
  • 嘿,谢谢杰夫。我仍然有一个问题,我会很感激提示。运行 format='table' 时,我似乎遇到了一个奇怪的错误,我每 90 分钟不能在 SO 上发布一个以上的问题,所以这里有一个截图:dropbox.com/s/lc06nmitdu29vek/…
  • 我会说您的文件已损坏,可能会被中断写入(这是这些文件的警告,这些文件非常快,但您一次只能使用 1 个进程/线程写入)。如果您中断操作,它们可能会在将元数据写入文件等时损坏。我很少看到这类事情。删除文件,然后重试。
  • @Jeff 这就是我正在做的事情。我将一堆 csv 加载到数据框中。我将数据帧合并为一个数据帧,包括一些处理。但最后我有一个数据框,是的,有 NaN,但这很好。问题是这个处理需要一些时间,我想将我的结果保存到我将来会查询的 h5 中。此错误是可重现的,但我将重新启动我的虚拟机。我的问题现已发布:stackoverflow.com/questions/26964964/…

标签: python pandas hdf5 pytables


【解决方案1】:

写入 h5 文件时,选择pandas.to_hdf(<path>,<key>,format='tables'),这样可以选择存储的子集。但是,这是一个错误,因为您应该得到一个错误。

据 Jeff (https://stackoverflow.com/users/644898/jeff) 称,

这是一个已知错误并在此处进行了修复:github.com/pydata/pandas/issues/8287

欢迎拉取请求。

【讨论】:

    猜你喜欢
    • 2017-10-07
    • 2017-05-07
    • 1970-01-01
    • 1970-01-01
    • 2017-02-14
    • 2011-05-05
    • 1970-01-01
    • 1970-01-01
    • 2011-11-07
    相关资源
    最近更新 更多