【发布时间】:2021-06-30 20:48:26
【问题描述】:
我正在使用 Pytorch Lightning 来训练我的模型(在 GPU 设备上,使用 DDP),TensorBoard 是 Lightning 使用的默认记录器。
我的代码设置为分别记录每个训练和验证步骤的训练和验证损失。
class MyLightningModel(pl.LightningModule):
def training_step(self, batch):
x, labels = batch
out = self(x)
loss = F.mse_loss(out, labels)
self.log("train_loss", loss)
return loss
def validation_step(self, batch):
x, labels = batch
out = self(x)
loss = F.mse_loss(out, labels)
self.log("val_loss", loss)
return loss
TensorBoard 在SCALERS 选项卡中正确绘制了train_loss 和val_loss 图表。但是,在 HPARAMS 选项卡的左侧栏上,Metrics 下只有 hp_metric 可见。
但是,在 HPARAMS 选项卡的左侧栏中,Metrics 下只有 hp_metric 可见。
我们如何将train_loss 和val_loss 添加到Metrics 部分?这样,我们就可以在PARALLEL COORDINATES VIEW 中使用val_loss 而不是hp_metric。
使用 Pytorch 1.8.1、Pytorch Lightning 1.2.6、TensorBoard 2.4.1
【问题讨论】:
标签: python machine-learning pytorch tensorboard pytorch-lightning