Caffe - 使用图像数据/图像标签对训练自动编码器答案

【问题标题】：Caffe - training autoencoder with image data/image label pairsCaffe - 使用图像数据/图像标签对训练自动编码器
【发布时间】：2023-05-22 00:52:01
【问题描述】：

我对 Caffe 很陌生。我的任务是在图像对上训练一个自动编码器网络，以 .tif 格式给出，其中一个是神经的灰度图像，另一个是相应的二进制掩码，它显示图像上是否存在某种结构。我在同一个“火车”文件夹中有这些。我想要完成的是对这些图像进行有意义的实验（分割、分类，未指定）。我的第一个问题是，如果没有现有的 train.txt，我不知道如何将图像输入网络。我可以直接使用图像，或者需要其他格式，如 lmdb、hdf5 吗？任何建议表示赞赏。

【问题讨论】：

您确定要使用“自动编码器”吗？如果你有标签，你似乎是在分类转换网络之后
感谢您的回复。这不是我的决定，我的目标是熟悉架构和数据处理。所以即使这不是最好的选择，我现在也必须这样做。我确实找到了 MNIST 分类的自动编码器解决方案，所以我怀疑这是可能的。我的问题是我没有用于 lmdb 创建的 .txt 只是图像..
这回答了您关于如何在 Python 中执行此操作的问题：*.com/a/39097123/5465000

标签： image label caffe autoencoder

【解决方案1】：

您可以通过简单的分类来完成它（现有的像 alexnet、googlenet、lenet）。您只能使用二进制掩码或灰度图像和类名来执行此操作。 Nvidia Digits 是一个很好的图形工具，可以用来制作对数据集和学习....

请看这个链接：

https://developer.nvidia.com/digits

【讨论】：

非常感谢您的回答。我的问题是我只能在 CPU 模式下使用 Caffe - 据我了解，DIGITS 需要不同的 Caffe 构建？
DIGITS 不允许在 CPU 模式下运行 caffe，因此您需要从源代码构建/安装 caffe。如果您不构建，请安装 caffe：caffe.berkeleyvision.org/installation.html.