【发布时间】:2020-01-03 10:51:38
【问题描述】:
我发现 tf.keras.losses.sparse_categorical_crossentropy 是一个了不起的类,它可以帮助我为具有大量输出类的神经网络创建损失函数。没有这个,就不可能训练模型,因为我发现 tf.keras.losses.categorical_crossentropy 由于将索引转换为非常大的 1-hot 向量而导致内存不足错误.
然而,我在理解 sparse_categorical_crossentropy 如何避免大内存问题方面存在问题。我查看了 TF 的 code,但确实不容易知道引擎盖下的内容。
那么,任何人都可以提供一些实现此功能的高级想法吗?实现是什么样的? 谢谢!
【问题讨论】:
标签: python tensorflow keras