【发布时间】:2020-04-25 22:00:28
【问题描述】:
我正在使用 tensorflow 在单台机器上训练多个 GPU 中的模型。但是,我发现速度比在单个 GPU 上训练要慢得多。我想知道 tensorflow 是并行还是按顺序在不同的 GPU 中执行子模型。例如:
x = 5
y = 2
with tf.device('/gpu:0'):
z1 = tf.multiply(x, y)
with tf.device('/gpu:1'):
z2 = tf.add(x, y)
/gpu:0和/gpu:1里面的代码是顺序执行的吗?如果按顺序,我怎样才能让这两个部分并行执行?假设这两个部分不相互依赖。
【问题讨论】:
标签: tensorflow