【发布时间】:2019-10-25 22:02:02
【问题描述】:
我最近完成了一个“相当不错”的 TF2/keras 图像识别模型,它使用多个层、SGD 优化并从 MobileNetv2 预训练模型开始。
我可以永远对此进行调整:添加/删除层、不同的优化算法、学习率、动量、各种数据集扩充等。我什至没有考虑从其他预训练模型开始。我将优化器从 SGD 更改为 ADAM(应该会更好,对吧?),结果稍微不准确。
那么,我如何收敛到更好的预训练模型、参数和值?这只是反复试验吗?训练我的模型(10 个 epoch)大约需要 45 分钟,当我调整这么多变量时,这似乎永远不会发生。
我想我可以编写一个 python 框架来插入各种训练属性,然后让它运行几天。
【问题讨论】:
标签: python tensorflow keras