【发布时间】:2019-06-18 15:15:55
【问题描述】:
我正在为回归问题训练自动编码器 DNN。需要有关如何改进培训过程的建议。
训练样本的总数约为 100,000。我使用 Keras 来拟合模型,设置 validation_split = 0.1。经过训练,我画了损失函数变化,得到了下图。从这里可以看出,验证损失是不稳定的,平均值非常接近训练损失。
我的问题是:基于此,我应该尝试改进培训过程的下一步是什么?
[于 2019 年 1 月 26 日编辑] 网络架构细节如下: 它有 1 个 50 个节点的潜在层。输入层和输出层分别有 1000 个节点。隐藏层的激活是 ReLU。损失函数是 MSE。对于优化器,我使用带有默认参数设置的 Adadelta。我也尝试设置 lr=0.5,但得到了非常相似的结果。数据的不同特征在 -10 到 10 之间缩放,均值为 0。
【问题讨论】:
标签: optimization keras deep-learning autoencoder loss-function