【发布时间】:2020-12-19 00:20:27
【问题描述】:
我正在 Google Colab 中使用 Detectron2 训练 Faster-RCNN 模型。我想跟踪我的权重和偏差 (WandB) 实验。
我的数据集已上传到 Google Drive 并通过以下方式安装到会话:
from google.colab import drive
drive.mount('/content/gdrive')
听从https://github.com/facebookresearch/detectron2/issues/774的建议 我正在尝试通过 Tensorboard 将 WandB 与:
import wandb
wandb.init(sync_tensorboard=True)
训练开始后,我反复收到以下错误:
wandb: ERROR Unable to log event [Errno 95] Operation not supported: '/content/gdrive/My Drive/Data/output/events.out.tfevents.1598810231.3dc4616192b5.103.0' -> '/content/gdrive/My Drive/Data/wandb/run-20200830_175618-3fp3tyhs/events.out.tfevents.1598810231.3dc4616192b5.103.0'
在这种情况下,在我的 WandB 帐户中,我可以看到有一个正在进行的实验正在运行,但没有损失、学习率等日志,只有 GPU 规格等硬件信息出现。
有趣的是,当我在 Detectron2 的 Demo Colab Notebook (https://colab.research.google.com/drive/16jcaJoc6bCFAQ96jDe2HwtXj7BMD_-m5) 中添加 Tensorboard 和 WandB 之间的链接时,它运行良好:损失、学习率等的记录显示在我的 WandB 帐户中。
我可以就我的案例中出现的问题获得一些提示吗?
【问题讨论】:
标签: python pytorch google-colaboratory