【问题标题】:Vaex Displaying DataVaex 显示数据
【发布时间】:2020-08-06 05:04:10
【问题描述】:

我有一个 10.11 GB 的 CSV 文件,我已使用 dask 转换为 hdf5。它是 str、int 和 float 值的混合。当我尝试用 vaex 阅读它时,我只会得到屏幕截图中给出的数字。有人可以帮帮我吗?

截图:

【问题讨论】:

    标签: python vaex


    【解决方案1】:

    我不确定 dask(或 dask.dataframe)如何以 HDF5 格式存储数据。例如,Pandas 以基于行的格式存储数据。另一方面,vaex 需要基于列的 HDF5 文件。

    从您的屏幕截图中,我看到您的 hdf5 文件还保留了索引列 - vaex 没有这样的列,并且只需要数据。

    为确保 HDF5 文件与 vaex 一起使用,最好使用 vaex 本身进行 CSV->HDF5 转换。否则,也许像箭头这样的东西会起作用,因为它是一个标准(而 HDF5 可以更灵活,这更难支持所有可能的存储数据版本)。

    【讨论】:

      猜你喜欢
      • 2020-08-20
      • 2020-10-20
      • 2021-10-24
      • 2019-11-08
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-07-02
      • 2021-01-26
      相关资源
      最近更新 更多