【发布时间】:2016-04-08 19:45:42
【问题描述】:
我正在尝试使用 RNN 进行特定领域的分类研究,并积累了数千万条文本。由于运行整个数据集需要几天甚至几个月的时间,我只选择了一小部分进行测试,比如 100 万个文本(80% 用于训练,20% 用于验证)。我使用词向量化对整个语料库进行了预训练,并将 Dropout 应用于模型以避免过度拟合。当它在 12 小时内训练 60000 条文本时,损失已经下降到相当低的水平,准确率达到 97%。我应该继续还是不继续?是否有助于继续培训?
它仍在运行第一个 epoch,如果我现在停止,恐怕模型不会覆盖整个...
【问题讨论】:
标签: machine-learning nlp neural-network lstm recurrent-neural-network