【问题标题】:Improve the neural network by analyzing the loss curve通过分析损失曲线改进神经网络
【发布时间】:2022-01-14 23:25:06
【问题描述】:

我建立了一些基于 LSTM 的网络。我调整了参数。结果如图所示,并不令人印象深刻。

如何理解什么是坏的?是数据集不好还是网络不好?

【问题讨论】:

    标签: keras lstm


    【解决方案1】:

    由于验证损失最初减少,后来增加,您遇到的是模型过度拟合

    由于训练损失不断减少,您的模型已经过度学习训练集,现在模型泛化效果不佳。由于这种验证损失增加。

    为避免过度拟合,您需要正则化您的模型。您可以使用L1L2 正则化技术。此外,您还可以在模型中尝试dropout

    现在来回答您的问题:
    如果数据集质量很好,即注释很好,并且肯定具有可以给出结果的特征,那么数据集和模型将共同决定预测的质量。

    由于您使用包含大量参数的 RNN,因此请确保数据集也很大,以避免 RNN 在小数据集上过度拟合。如果可用数据集很小,则从参数较少的小型深度学习开始(您可以构建一个小型神经网络),然后逐步扩大模型,直到您对预测分数感到满意。

    你也可以参考这个:https://towardsdatascience.com/rnn-training-tips-and-tricks-2bf687e67527

    【讨论】:

    • 是否存在自动检查数据集质量的方法?
    • 使用 LSTM 时,缩放输入特征的最佳方法是什么? -1 .. 1 还是 0 ..1?
    猜你喜欢
    • 2017-08-27
    • 2019-04-10
    • 2019-02-20
    • 2017-10-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-08-25
    • 2021-05-04
    相关资源
    最近更新 更多