【发布时间】:2019-03-15 11:37:02
【问题描述】:
数据 我正在尝试通过一项相当专业的任务(流量预测)来训练生物医学领域的模型。 我的输入包含视频剪辑,我想预测单个图像或视频。我对视频的每一帧都有像素级的基本事实,但视频的数量非常有限。 然而,我确实有很多相关场景的未标记数据,这就是我考虑迁移学习/预训练的原因。
架构 架构方面,我正在考虑 CNN、RNN 组合,其中 CNN 为 RNN 提供输入帧的表示,以了解输入帧之间的时间关系。
现在我的问题是:我使用什么样的 CNN,我在什么上预训练它?由于我正在处理生物医学数据,我会假设图像网络以及大多数其他图像数据集并没有真正帮助,因为图像内容非常不同。有没有我可以用于此目的的数据集/任务/网络?
【问题讨论】:
-
如果我正确理解您的问题,我建议您查看 TensorFlow Object Detection API。
标签: machine-learning computer-vision conv-neural-network pytorch rnn