【发布时间】:2024-05-18 16:30:01
【问题描述】:
我想并行运行经过训练的 CNN 的每一层,以减少前向传播期间的计算时间(基本上我想为涉及相机的实时应用程序运行 CNN,而不会过多地影响 FPS)。我将为每一层保留一个输入队列和一个输出队列。每个层都可以处理来自输入层的 blob 并将其转储到输出层(这在逻辑上可以并行完成)。每层的输出队列将作为下一层的输入队列。然后我将从最后一层的输出队列(它将是一个二进制标签)中收集所有输出并处理它们。所以我的问题是,是否可以在 Caffe 或 Tensorflow 中并行运行 CNN 的每一层来实现这一点。
【问题讨论】:
标签: optimization tensorflow parallel-processing caffe conv-neural-network