【发布时间】:2021-12-10 13:19:12
【问题描述】:
我发现我的台式机 CPU 与我在 Neural Compute Stick 2 VPU 上运行时的推理性能存在显着差异 - 在 VPU 上慢了近 500 毫秒。这是花费时间最多且差异最大的一行:
result = exec_net.infer( inputs={input_layer_ir: blob} )
我的台式机是我的游戏机,有一个非常快的 Intel CPU。也就是说,这是 VPU 和 CPU 之间预期的数量级差异吗?
CPU 速度非常快,例如 0.07 秒,而 VPU 约为 0.5。
这是开放动物园样本中的道路分割模型。
【问题讨论】:
-
哪个更快?两者的实际速度是多少?如果我们不知道它是否超过 10 秒或超过 1 秒或什么,我们不知道 500 毫秒的速度差异有多大。什么大小的数据?台式机CPU的实际型号是什么?核心数量范围很大。
-
什么样的神经网络?什么样的 CPU?
-
使用 GPU/加速器的人总是忘记会有延迟和设置成本。
-
您不包括从 PC 到 Neural Stick 的数据移动时间,对吧?