【发布时间】:2021-01-27 19:23:03
【问题描述】:
在 Sagemaker 上的 Jupyter Notebooks 中运行一段代码时,我时不时会断开连接。我通常只是重新启动我的笔记本并再次运行所有单元。但是,我想知道是否有办法重新连接到我的实例而不会丢失我的进度。此刻,它显示底部栏有“无内核”,但我的文件在内核会话选项卡中似乎处于活动状态。我可以恢复笔记本的变量和内容吗?另外,有没有办法防止将来内核断开连接?
请注意,我恢复到 tornado = 5.1.1,这似乎减少了断开连接的次数,但它仍然时不时发生。
【问题讨论】:
-
从描述上看,好像是用 notebook 训练模型,对吗?
-
实际上是在训练前对数据集进行预处理时发生的。
-
如果数据量大,建议单独运行数据处理作业。您可以连接到 EMR 集群并在 EMR 集群上运行 spark 作业,并将输出存储在 S3 上。
标签: amazon-web-services jupyter-notebook amazon-sagemaker