【问题标题】:Tensorflow gpu not able to train my Xception modelTensorflow gpu 无法训练我的 Xception 模型
【发布时间】:2021-03-19 11:12:43
【问题描述】:

我正在使用 tensorflow-gpu 训练一个 Xception 模型。我收到此错误:

FailedPreconditionError:发现 2 个根本错误。 (0) 失败的前提条件:从容器:localhost 读取资源变量 block14_sepconv2_bn_5/moving_variance 时出错。这可能意味着该变量未初始化。未找到:资源 localhost/block14_sepconv2_bn_5/moving_variance/N10tensorflow3VarE 不存在。 [[{{node FusedBatchNormV3/ReadVariableOp_1}}]] [[block9_sepconv3_bn_5/cond/else/_9661/OptionalFromValue_3/_1548]] (1) 前置条件失败:从 Container: localhost 读取资源变量 block14_sepconv2_bn_5/moving_variance 时出错。这可能意味着该变量未初始化。未找到:资源 localhost/block14_sepconv2_bn_5/moving_variance/N10tensorflow3VarE 不存在。 [[{{node FusedBatchNormV3/ReadVariableOp_1}}]] 0 次成功操作。 0 个衍生错误被忽略。

当我重新加载时,它会在不同的转换层上给出错误。我以前没有使用过 gpu,所以我不知道它是如何工作的。感谢您的帮助!

【问题讨论】:

  • 您能分享您尝试执行的代码吗?它有助于轻松重现您的问题。以便我们可以尽力帮助您。谢谢!
  • 嘿,我不知道那天发生了什么。从那以后,我添加了一些来自其他论坛的代码行。有些工作,有些没有。但我完全忘记记录了。现在可以正常使用了。
  • 我使用了这些行: from tensorflow.compat.v1 import ConfigProto from tensorflow.compat.v1 import InteractiveSession config = ConfigProto() config.gpu_options.allow_growth = True config.gpu_options.per_process_gpu_memory_fraction = 0.5 session = InteractiveSession(config=config) 这很有帮助!还是谢谢!!

标签: tensorflow jupyter-notebook image-classification


【解决方案1】:

问题已解决。虽然我不确定发生了什么,但我认为这是一个内存问题。下面的代码行对我操纵内存使用有很大帮助:

从 tensorflow.compat.v1 导入 ConfigProto 从 tensorflow.compat.v1 导入 InteractiveSession

config = ConfigProto() config.gpu_options.allow_growth = True config.gpu_options.per_process_gpu_memory_fraction = 0.5 session = InteractiveSession(config=config)

【讨论】: