【发布时间】:2020-12-25 20:29:54
【问题描述】:
我是 pytorch 的初学者。我在github上看到有的深度学习模型有model.train(),有的没有,但是可以正常运行。我想知道是否需要 model.train() ?有什么效果?
【问题讨论】:
标签: pytorch
我是 pytorch 的初学者。我在github上看到有的深度学习模型有model.train(),有的没有,但是可以正常运行。我想知道是否需要 model.train() ?有什么效果?
【问题讨论】:
标签: pytorch
train 模式或eval 模式仅在您的模块在训练/测试中表现不对称(例如 BatchNorm、Dropout)时才重要。我想强调一点,它根本不影响梯度累积。即使使用非对称模块,也可以在eval 模式下完美地训练模型。有些人这样做是为了在使用预训练的 ImageNet 模型进行训练时节省内存。
如果你没有任何不对称的模块,那根本没关系。
默认情况下,所有模块都以training=True开头。
【讨论】: