【问题标题】:Keras NoteBook GPU TimeoutKeras NoteBook GPU 超时
【发布时间】:2017-02-06 08:30:51
【问题描述】:

我正在尝试在 Windows 10 机器上使用我的 GTX 980 gpu 在 jupyter 笔记本上运行带有 tensorflow 的 keras。如果我用我的 gpu 单独运行 tensorflow,它的工作非常好,没有任何问题。但是对于大量 epoch 的 keras 界面会出现问题。

keras 模型使用 GPU 并在我的 epoch 数较低时给出输出,如下所示

with tf.device('/gpu:0'):
    model.compile('adam', 'categorical_crossentropy', ['accuracy'])
    history = model.fit(X_normalized,y_one_hot,batch_size=128,nb_epoch=2,validation_split=0.2)

下面是输出

训练 31367 个样本,验证 7842 个样本 纪元 1/2 31367/31367 [===============================] - 3s - 损失:1.7640 - acc:0.5438 - val_loss:1.2872 - val_acc:0.6486-ETA:0s-损失:1.8827-acc:0.5145-ETA:0s-损失:1.7732-acc:0.5416

纪元 2/2 31367/31367 [===============================] - 2s - 损失:0.8539 - acc:0.7765 - val_loss:0.7958 - val_acc: 0.7615

如果 epoch 的数量很高,那么它将超时并出现以下错误并且网页显示忙

119999 毫秒后的 WebSocket ping 超时。

我该如何解决这个错误?

【问题讨论】:

  • 您应该提供完整的错误信息。
  • 我认为这是 Jupyter 的一个已知问题。您可以将您的笔记本下载为.py 文件并从终端运行它

标签: machine-learning tensorflow jupyter-notebook keras


【解决方案1】:

我猜这个问题与 Windows 上的 TDR(超时检测和恢复)有关。 基本上,操作系统认为 GPU 挂起并且不再响应,因此操作系统将重新启动显卡。您可以尝试禁用 TDR 或延长 TdRDelay 的上限。更多详情请见https://docs.microsoft.com/en-us/windows-hardware/drivers/display/tdr-registry-keys

【讨论】:

    猜你喜欢
    • 2021-02-09
    • 1970-01-01
    • 2020-07-17
    • 1970-01-01
    • 2019-07-13
    • 2021-05-17
    • 1970-01-01
    • 2023-03-21
    • 2019-09-25
    相关资源
    最近更新 更多