【发布时间】:2019-09-29 09:46:17
【问题描述】:
我在Java 中创建了一个简单的前馈神经网络库 - 我需要一个基准来比较我的库并对其进行故障排除。
电脑规格:
- AMD 锐龙 7 2700X 八核处理器
- 内存 16.0 GB
- WINDOWS 10 操作系统
- JVM 参数:
-Xms1024m-Xmx8192m
请注意,我没有使用 GPU。
请列出以下规格:
- 电脑规格?
- GPU 或 CPU(提供了 CPU,但 GPU 是很好的信息)
- 输入数量 784(这是固定的)
- 对于每一层:
- 有多少个节点?
- 什么激活函数?
- 输出层:
- 有多少个节点? (分类时为 10,回归时为 1)
- 什么激活函数?
- 什么损失函数?
- 什么梯度下降算法(即:vanilla)
- 批量大小是多少?
- 多少个纪元? (不是迭代)
- 最后,训练时间和准确率是多少?
非常感谢
编辑
只是为了说明我正在处理的内容。我用
创建了一个网络- 784 个输入节点
- 784 在隐藏层 0
- 隐藏层 1 中有 256 个
- 隐藏层 2 中的 128 个
- 1 个输出节点
- 小批量大小 5
- 16 个线程用于反向传播 它已经训练了大约 8 个小时,只完成了 694 次迭代——这甚至不到一个 epoch 的 20%。
我已经看到了一些声明,这如何在几分钟内完成?
【问题讨论】:
-
我不清楚你想要什么。您是否希望有人使用 MNIST 数据集训练网络并报告性能?
-
@rayryeng 我假设有人已经有了 - 他们有可用的信息
-
可能不是 - MNIST 是一个玩具数据集,通常仅用于演示目的,以表明神经网络可以在几个时期内实现更高的准确性和性能。无论您使用任何包或框架,结果都是相当可重现的。很可能有人必须设置它并再次运行它才能给你想要的东西——我不相信很多人会想要这样做。
-
@rayryeng 然后我会添加赏金 - 或者 Venmo 某人:)
-
@EdvBeq,您可能需要考虑在 AWS、GCP、Azure 等中启动不同规格的虚拟机并自己构建所需的列表:)
标签: python tensorflow neural-network mnist