【问题标题】:Caffe - training autoencoder with image data/image label pairsCaffe - 使用图像数据/图像标签对训练自动编码器
【发布时间】:2023-05-22 00:52:01
【问题描述】:

我对 Caffe 很陌生。我的任务是在图像对上训练一个自动编码器网络,以 .tif 格式给出,其中一个是神经的灰度图像,另一个是相应的二进制掩码,它显示图像上是否存在某种结构。我在同一个“火车”文件夹中有这些。我想要完成的是对这些图像进行有意义的实验(分割、分类,未指定)。我的第一个问题是,如果没有现有的 train.txt,我不知道如何将图像输入网络。我可以直接使用图像,或者需要其他格式,如 lmdb、hdf5 吗?任何建议表示赞赏。

【问题讨论】:

  • 您确定要使用“自动编码器”吗?如果你有标签,你似乎是在分类转换网络之后
  • 感谢您的回复。这不是我的决定,我的目标是熟悉架构和数据处理。所以即使这不是最好的选择,我现在也必须这样做。我确实找到了 MNIST 分类的自动编码器解决方案,所以我怀疑这是可能的。我的问题是我没有用于 lmdb 创建的 .txt 只是图像..
  • 这回答了您关于如何在 Python 中执行此操作的问题:*.com/a/39097123/5465000

标签: image label caffe autoencoder


【解决方案1】:

您可以通过简单的分类来完成它(现有的像 alexnet、googlenet、lenet)。您只能使用二进制掩码或灰度图像和类名来执行此操作。 Nvidia Digits 是一个很好的图形工具,可以用来制作对数据集和学习....

请看这个链接:

https://developer.nvidia.com/digits

【讨论】:

  • 非常感谢您的回答。我的问题是我只能在 CPU 模式下使用 Caffe - 据我了解,DIGITS 需要不同的 Caffe 构建?
  • DIGITS 不允许在 CPU 模式下运行 caffe,因此您需要从源代码构建/安装 caffe。如果您不构建,请安装 caffe:caffe.berkeleyvision.org/installation.html.
最近更新 更多