【问题标题】:How to train and save model on google colab that would take days to finish training?如何在 google colab 上训练和保存模型需要数天才能完成训练?
【发布时间】:2020-06-05 23:10:12
【问题描述】:

我在 google colab 上训练一个自然语言模型,从目前的训练进度来看,我的模型至少需要 1 到 2 天才能完成训练。训练后,我还想将模型保存在我的谷歌驱动器中。所以,基本上这里有问题。

(1) 我正在使用我大学的互联网,它在将近 90 分钟后将我注销。所以,我希望我的模型继续在云上训练,即使在我的大学 wifi 将我注销之后。

我在 YouTube 上观看了 this 视频,该视频编写了一个脚本以在一段时间后定期单击连接按钮,但这对我没有帮助,因为我的大学 wifi 将在 90 分钟后断开互联网连接,我必须登录再次重新连接。

我还在 stackoverflow 上查看了 this 类似的问题,但我无法理解这是否能够解决我的问题。一旦没有互联网,我想保持我的模型训练,并在训练完成后将我的模型保存到我的谷歌驱动器。我可以在我的代码中添加一个脚本来保存模型,但是我怎样才能确定我的模型在云上持续运行呢?这个问题有点像在关闭浏览器后保持会话连接。

【问题讨论】:

    标签: deep-learning cloud google-colaboratory


    【解决方案1】:

    根据我的实验,即使您的网络中断,您的模型训练仍会运行,但在您断开连接后不久,训练就会停止。我认为您可以每隔几个 epoch 保存一次模型,以便以后可以继续训练。

    关于“关闭浏览器后保持会话连接”,关闭浏览器是安全的,只需重新打开它,一切仍然存在。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-02-12
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多