【问题标题】:Copy data from CSV and PDF into HDF5 using Python使用 Python 将数据从 CSV 和 PDF 复制到 HDF5
【发布时间】:2020-12-05 15:15:32
【问题描述】:

如何使用 python 将文件从特定文件夹传输到 hdf5 文件类型?文件类型为 PDF 和 CSV。 例如,我有这个路径 /root/Desktop/mal/ex1/ 包含许多 CSV 文件和 PDF 文件 所有这些我都不会让 1 个单独的 hdf5 文件包含所有这些 CSV 和 PDF 文件。

【问题讨论】:

    标签: python python-3.x hdf5


    【解决方案1】:

    您可以根据您的需求细节修改以下代码:

    import numpy as np
    import h5py
    import pandas as pd
    import glob
    
    yourpath = '/root/Desktop/mal/ex1'
    all_files = glob.glob(yourpath + "/*.csv")
    
    li = []
    
    for filename in all_files:
        df = pd.read_csv(filename,index_col=None, header=0)
        li.append(df)
    
    frame = pd.concat(li, axis=0, ignore_index=True)
    
    hf = h5py.File('data.h5', 'w')
    hf.create_dataset('dataset_1', data=frame)
    hf.close()
    

    【讨论】:

    • 感谢您的回答,但很难为同一个浴缸中的每个 csv 文件执行此操作,我有 100 多个 csv 文件,我如何将它们全部放在同一个 hdf5 文件中??跨度>
    • 我已根据您的评论更新了答案。现在,它可以考虑给定路径中的整个 csv 文件。
    • 很抱歉,但我仍然面临这个错误文件“5.py”,第 15 行,在 框架 = pd.concat(li, axis=0, ignore_index=True) 文件“ /usr/local/lib/python3.7/site-packages/pandas/core/reshape/concat.py”,第 281 行,在 concat sort=sort,文件“/usr/local/lib/python3.7/site- packages/pandas/core/reshape/concat.py",第 329 行,在 init 中引发 ValueError("No objects to concatenate") ValueError: No objects to concatenate
    猜你喜欢
    • 2015-07-15
    • 1970-01-01
    • 1970-01-01
    • 2021-05-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-05-22
    • 2021-10-06
    相关资源
    最近更新 更多