【发布时间】:2021-12-07 14:53:07
【问题描述】:
我想在训练期间保留多个检查点以便以后分析它们,但Trainer 还保存其他文件以恢复训练。有没有办法只保存模型以节省空间和编写时间?
15K rng_state.pth
906 trainer_state.json
623 scheduler.pt
2,1G optimizer.pt
2,5K training_args.bin
1,1G pytorch_model.bin
900 config.json
我可以在训练后删除优化器,但我也在使用写入速度较慢的磁盘,所以这也是一个考虑因素
【问题讨论】: