【问题标题】:How to build a dataset with h5py?如何使用 h5py 构建数据集?
【发布时间】:2020-03-26 12:42:47
【问题描述】:

我有以下数据集:

类类别:1,2,3 每个类包含 320x240 的 rgb 图像

dataset
   |---- training_set
         |---- 1
               |--- rgb_1.png
               |--- rgb_2.png
         |---- 2
               |--- rgb_1.png
               |--- rgb_2.png
         |---- 3
               |--- rgb_1.png
               |--- rgb_2.png
   |---- test_set
         |---- 1
               |--- rgb_1.png
               |--- rgb_2.png 
         |---- 2
               |--- rgb_1.png
               |--- rgb_2.png
         |---- 3
               |--- rgb_1.png
               |--- rgb_2.png

因为当我在 google colab 中训练模型时,它比我的计算机非常慢,我认为是因为数据集在 google drive 中,所以我尝试了另一种使用 h5py 创建数据集的解决方案。

请问,如何用 h5py 构建这个数据集?

【问题讨论】:

标签: python tensorflow keras google-colaboratory h5py


【解决方案1】:

简短的回答是使用create_dataset()。您需要的一切都在@jakub 提供的链接中。要填充数据集,您需要从图像创建一个 NumPy 数组。我不知道最好的方法。你需要弄清楚那部分。在我的示例中,我使用了cv2.imread()

您可以从这段简单的代码开始:

import h5py, cv2
import numpy as np
# Create an array for image data
img_arr = cv2.imread(imgFile)
# returns a np array 
with h5py.File('imagedata.h5','w') as h5f :
    dset = h5f.create_dataset("image1", data=img_arr)

【讨论】:

    猜你喜欢
    • 2018-01-05
    • 2021-01-02
    • 2016-01-10
    • 2015-10-29
    • 2016-03-23
    • 2019-10-05
    • 2013-04-19
    • 2017-06-12
    相关资源
    最近更新 更多