【问题标题】:Pytorch lightning saving model during the epochPytorch 时代闪电节约模型
【发布时间】:2021-04-06 08:41:00
【问题描述】:

我想在每次验证循环结束时保存一个检查点。我将val_check_interval 设置为0.2,因此我在每个时期都有5 个验证循环,但检查点回调仅在时期结束时保存模型。在每个验证循环之后,我找不到一种简单(或困难)的方法来保存模型。这似乎有点奇怪,因为除了保存检查点之外,我看不到进行验证循环的理由。

最简单的方法是什么?

谢谢,

吉拉德

【问题讨论】:

    标签: pytorch pytorch-lightning


    【解决方案1】:

    你检查过pytorch_lightning.callbacks.model_checkpoint.ModelCheckpoint吗? 不确定它是否存在于您的版本中,但是将 every_n_val_epochs 设置为 1 应该可以。如果是这样,它应该在每个验证循环之后保存您的模型检查点。

    【讨论】:

      【解决方案2】:

      来自lightning docssave_on_train_epoch_end (Optional[bool]) – 是否在训练周期结束时运行检查点。如果为 False,则检查在验证结束时运行。

      在 ModelCheckpoint 中使用 save_on_train_epoch_end = False 标志在训练器中进行回调应该可以解决这个问题。

      【讨论】:

        猜你喜欢
        • 2023-03-10
        • 2021-04-24
        • 2021-11-08
        • 2022-12-06
        • 1970-01-01
        • 2021-03-03
        • 2021-09-22
        • 2022-08-06
        • 2021-02-28
        相关资源
        最近更新 更多