如何创建自己的数据集来训练/测试卷积神经网络答案

【问题标题】：How to create my own dataset to train/test a convolutional neural network如何创建自己的数据集来训练/测试卷积神经网络
【发布时间】：2019-01-08 02:15:34
【问题描述】：

所以这是我的问题：

我想制作我自己的数据集，使用运动捕捉摄像头系统获取地面真实姿势，并使用一个 RGB 摄像头获取图像，然后将其用作我的网络的输入，训练/测试一个 convNet。

我查看了 tensorflow、caffe 和 Matlab 的其他数据集。我查看了 MNIST、Cats/Dogs、Iris、LSP、HumanEva、HumanEva3.6、FLIC 等数据集，并尽我所能查看并尝试理解他们的数据。我看到网上有人试图制作自己的数据集。一件事通常是当您使用他们的数据集作为示例时，您会下载一个已经包含标签的 .txt 文件。

如果有人可以向我解释如何使用带有标签的图像数据将其输入我的网络，那将是一个巨大的帮助。在使用 tensorflow 将 .txt 文件输入网络并获得正确的预测输出之前，我已经编写了代码。但是，我的大脑缺少一些东西来理解如何输入带有标签的图像。如何创建该数据集？

【问题讨论】：

标签： python tensorflow conv-neural-network

【解决方案1】：

您的输入图像和标签是两个独立的变量。您将编写单独的代码来导入它们。视频通常需要转换为 JPG 文件（直接读取视频文件非常痛苦，主要是因为您不能轻易随意跳过视频）。

可能最简单的构建数据的方法是通过包含文件名、poseinfoA、poseinfoB 等的 CSV。文件名指的是磁盘上的 JPG 图像。

要开始学习基础知识，我建议查看 Aymericdamen 教程示例，我在任何地方都找不到如此清晰简洁的教程。

https://github.com/aymericdamien/TensorFlow-Examples

不过，这些示例并未详细介绍数据输入管道。要在 tensorflow 中建立良好的数据输入管道，我建议您使用新的（自 TF 1.4 起）Dataset 对象。它将迫使您进入一个良好的数据输入管道工作流程，并且这是所有数据输入在 tensorflow 中的方式，因此值得学习。以这种方式编写它也很容易测试和调试。这是您要遵循的指南。

https://www.tensorflow.org/programmers_guide/datasets

您可以从 CSV 启动您的 Dataset 对象，并使用 dataset.map_fn() 使用 tf.image.decode_jpeg 加载图像

由于您正在进行姿势估计，我还将推荐一个我最近看到的不错的博客，您可能会感兴趣。主题是分割，但姿态估计是相当相关的。

http://blog.qure.ai/notes/semantic-segmentation-deep-learning-review

【讨论】：