【问题标题】:Weight & Biases Detectron2 Google Colab - wandb: ERROR Unable to log event [Errno 95] Operation not supported重量和偏差 Detectron2 Google Colab - wandb:错误无法记录事件 [Errno 95] 不支持操作
【发布时间】:2020-12-19 00:20:27
【问题描述】:

我正在 Google Colab 中使用 Detectron2 训练 Faster-RCNN 模型。我想跟踪我的权重和偏差 (WandB) 实验。

我的数据集已上传到 Google Drive 并通过以下方式安装到会话:

from google.colab import drive
drive.mount('/content/gdrive')

听从https://github.com/facebookresearch/detectron2/issues/774的建议 我正在尝试通过 Tensorboard 将 WandB 与:

import wandb
wandb.init(sync_tensorboard=True)

训练开始后,我反复收到以下错误:

wandb: ERROR Unable to log event [Errno 95] Operation not supported: '/content/gdrive/My Drive/Data/output/events.out.tfevents.1598810231.3dc4616192b5.103.0' -> '/content/gdrive/My Drive/Data/wandb/run-20200830_175618-3fp3tyhs/events.out.tfevents.1598810231.3dc4616192b5.103.0'

在这种情况下,在我的 WandB 帐户中,我可以看到有一个正在进行的实验正在运行,但没有损失、学习率等日志,只有 GPU 规格等硬件信息出现。

有趣的是,当我在 Detectron2 的 Demo Colab Notebook (https://colab.research.google.com/drive/16jcaJoc6bCFAQ96jDe2HwtXj7BMD_-m5) 中添加 Tensorboard 和 WandB 之间的链接时,它运行良好:损失、学习率等的记录显示在我的 WandB 帐户中。

我可以就我的案例中出现的问题获得一些提示吗?

【问题讨论】:

    标签: python pytorch google-colaboratory


    【解决方案1】:

    一周后问题消失了。我认为一定有人修复了导致此问题的错误。我现在可以使用:

    import wandb
    wandb.init(sync_tensorboard=True)
    

    所有训练指标都同步到 WandB 没有任何问题。

    【讨论】:

      猜你喜欢
      • 2020-05-24
      • 1970-01-01
      • 1970-01-01
      • 2022-10-25
      • 1970-01-01
      • 2022-08-05
      • 2022-07-23
      • 2014-03-10
      • 1970-01-01
      相关资源
      最近更新 更多