【发布时间】:2016-08-27 19:15:42
【问题描述】:
通过卷积网络传递视频帧并获得输出特征图后,如何将该数据传递到 LSTM?另外,如何通过 CNN 将多个帧传递给 LSTM?
在其他作品中,我想用 CNN 处理视频帧以获得空间特征。然后我想将这些特征传递给 LSTM 以对空间特征进行时间处理。如何将 LSTM 连接到视频功能?例如,如果输入视频是 56x56,然后当通过所有 CNN 层时,假设它以 20:5x5 的形式出现。这些是如何逐帧连接到 LSTM 的?他们应该先通过全连接层吗?
谢谢,乔恩
【问题讨论】:
-
你可以简单地采用reshape操作:stackoverflow.com/a/63789979/10375049
标签: video tensorflow lstm