【发布时间】:2018-11-28 10:57:56
【问题描述】:
我正在训练 faster_rcnn_inception 模块以在自定义数据集上进行对象检测。 在 training 目录中,我们找到了 eval_0 文件夹和 tensorflow 生成的 events.out.tfevents.xxxxxx 文件。
培训目录结构如下
+training_dir
+eval_0
-events.out.tfevents.1542309785.instance-1 1.2GB
-events.out.tfevents.1542367255.instance-1 5.3GB
-events.out.tfevents.1542369886.instance-1 3.6GB
-events.out.tfevents.1542624154.instance-1 31MB
-events.out.tfevents.1543060258.instance-1 19MB
-events.out.tfevents.1543066775.instance-2 1.6GB
-events.out.tfevents.1542308099.instance-1 17MB
-events.out.tfevents.1542308928.instance-1 17MB
-events.out.tfevents.1542366369.instance-1 17MB
-events.out.tfevents.1542369000.instance-1 17MB
-events.out.tfevents.1542623262.instance-1 17MB
-events.out.tfevents.1543064936.instance-2 17MB
-events.out.tfevents.1543065796.instance-2 17MB
-events.out.tfevents.1543065880.instance-2 17MB
-model.ckpt-96004.data-00000-of-00001
-model.ckpt-96004.data-00000-of-00001
-model.ckpt-96004.index
-model.ckpt-96004.meta
-model.ckpt-96108.data-00000-of-00001
-model.ckpt-96108.index
-model.ckpt-96108.meta
据我了解,eval_0 文件夹中的 tfevents 文件是 evaluation 的摘要文件和 training_dir 中的 tfevents 文件> 是培训的摘要文件。
我已多次中断训练过程并从最近的检查点继续。 我也了解重新启动训练过程会生成新的 tfevents 文件。
我的问题如下:
为什么训练 tfevents_files 具有相同的大小,但如果 eval_0/tfevents_files 大小不同?
为什么中断训练会在训练中生成新的 tfevents_file 文件夹,但在 eval_0 的情况下未观察到相同的情况?
我可以删除 eval_0 中的所有 tfevents 文件,除了最新的文件吗?可以 对训练或进化历史有影响吗?
【问题讨论】:
标签: ubuntu tensorflow tensorboard