【发布时间】:2017-12-12 03:08:43
【问题描述】:
我正致力于在 LIDC-IDRI 数据集上训练分割网络 U-net。目前有两种训练策略:
- 从头开始在整个训练集上训练模型(40k 步,180k 步)。
- 在整个训练集的 10% 上训练模型。收敛后(30k 步),继续在整个训练集上训练模型(10k 步)。
以Dice coefficient作为损失函数,也用于V-net架构(paper),使用方法2训练的模型总是优于使用方法1。前者可以达到0.735的Dice分数,而后者只能达到0.71。
顺便说一句,我的 U-net 模型是在 TensorFlow 中实现的,模型是在 NVidia GTX 1080Ti 上训练的
谁能给出一些解释或参考。谢谢!
【问题讨论】:
标签: neural-network conv-neural-network image-segmentation training-data gradient-descent