数据处理工具箱概述

Pytorch涉及数据处理(数据装载,数据预处理,数据增强等)主要工具包及相互关系如图所示:
torch.utils.data和torvision等PyTorch数据处理工具箱
图的左边是torch.utils.data工具包,主要包括以下4个类:

  1. Dataset:是一个抽象类,其他数据集要继承这个类,并且重写其中两个方法(getitem, len)。
  2. DataLoader:定义一个新的迭代器,实现批量(batch)读取,打乱数据(shuffle)并提供并行加速等功能。
  3. random_split: 把数据集随机拆分为给定长度的非重叠的新数据集
  4. Sampler:多种采样函数

图中间的torchvision是Pytorch可视化处理工具,包括四个类:

  1. datasets: 提供常用的数据集加载,设计上继承自torch.utils.data.Dataset
  2. models:提供深度学习中各种经典的网络结构以及训练好的模型(如果选择pretrained=True)
  3. transforms:常用的数据预处理操作,主要包括对Tensor及PIL Image对象的操作
  4. utils: 含两个函数,一个是make_grid, 它能将多张图片拼接在一个网格中;另一个是save_img,它能将tensor保存成图片

相关文章:

  • 2022-02-04
  • 2021-07-17
  • 2021-11-30
  • 2021-11-10
  • 2022-02-19
  • 2021-06-30
  • 2021-11-07
  • 2021-12-15
猜你喜欢
  • 2022-12-23
  • 2021-09-03
  • 2021-12-21
  • 2021-12-05
  • 2021-12-16
  • 2022-02-08
相关资源
相似解决方案