【发布时间】:2017-08-01 01:32:13
【问题描述】:
我正在调整 SGD 和 Adam 的学习率。我将首先尝试使用 SGD。我有一个关于学习率选择的问题。我应该首先尝试什么:低学习率还是高学习率?我阅读了一些建议尝试使用高学习率然后通过调度来降低它的参考资料。这样对吗? 对于亚当来说,这是一个自适应学习率。 Adam 方法的学习率往往不到 SGD 学习率的 5 倍或 10 倍是不是?
【问题讨论】:
-
取决于您的数据集。您可以使用交叉验证选择正确的学习率。
-
谢谢。问题很耗时。我在训练集中有 5 个科目。我将使用 4 个主题进行训练和 1 个主题进行验证。不要担心有限的数据集,因为这是我的任务。我将通过随机选择 1 个主题进行验证,剩余 4 个主题进行训练并选择一个学习率来使用交叉验证。每次,我必须花 1 天时间来完成它。因此,对于 4 次交叉验证,我必须花费大约 4 天。并再次改变学习率。您对交叉验证有什么建议吗?
标签: machine-learning tensorflow neural-network deep-learning