【问题标题】:How does a Pytorch neural network load dataset into GPUPytorch 神经网络如何将数据集加载到 GPU 中
【发布时间】:2021-07-05 13:25:30
【问题描述】:

将数据集加载到 GPU 中进行训练时,Pytorch NN 会加载整个数据集还是仅加载批次?

我有一个 33GB 的数据集,可以很好地适应我的普通 RAM (64GB),但我只有 16GB 的 GPU RAM (T4)。只要 Pytorch 一次只将一批加载到 GPU 中,那应该可以正常工作而没有任何内存问题?

【问题讨论】:

  • 需要注意的一点是,存储在驱动器 (33GB) 中的数据集通常是压缩形式的(例如图像的 png 或 jpg)。当您将其加载为张量(在 GPU 或 CPU 上)时,它们将处于未压缩形式,因此将占用比磁盘空间大得多的空间。因此,您对磁盘内存和 GPU 内存/系统 RAM 的比较似乎无效。相反,您应该尝试将一批作为张量加载并检查 RAM 使用情况。

标签: neural-network pytorch gpu


【解决方案1】:

您可以一次将一批数据加载到 GPU 中。您应该使用数据加载器来获取一批数据,并初始化一个 Torch 设备实例以使用 GPU。

您可以查看以下教程。它使用数据加载器批量获取数据并使用torch设备将它们加载到GPU。

https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html

【讨论】:

    猜你喜欢
    • 2020-05-08
    • 1970-01-01
    • 2019-05-16
    • 2021-06-21
    • 2018-12-16
    • 2012-05-15
    • 2017-04-25
    • 2023-02-07
    • 1970-01-01
    相关资源
    最近更新 更多