【发布时间】:2017-05-26 03:22:30
【问题描述】:
例如,我有 CNN,它试图从 MNIST 数据集中预测数字(使用 Keras 编写的代码)。它有 10 个输出,形成 softmax 层。只有一个输出可以为真(独立于从 0 到 9 的每个数字):
Real: [0, 1, 0, 0, 0, 0, 0, 0, 0, 0]
Predicted: [0.02, 0.9, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01, 0.01]
由于 softmax 的定义,预测的总和等于 1.0。
假设我有一个任务,我需要对一些可以分为几类的对象进行分类:
Real: [0, 1, 0, 1, 0, 1, 0, 0, 0, 1]
所以我需要以其他方式规范化。我需要在 [0, 1] 范围内给出值并且总和可以大于 1 的函数。
我需要这样的东西:
Predicted: [0.1, 0.9, 0.05, 0.9, 0.01, 0.8, 0.1, 0.01, 0.2, 0.9]
每个数字是对象属于给定类别的概率。之后,我可以使用像 0.5 这样的阈值来区分给定对象所属的类别。
出现以下问题:
- 那么可以使用哪个激活函数呢?
- 这个函数可能已经存在于 Keras 中了吗?
- 在这种情况下,您是否可以提出其他预测方法?
【问题讨论】:
-
看起来一些有用的 cmets 可以在这里找到:datascience.stackexchange.com/questions/13815/… 他们建议只使用 sigmoid 层。
-
在这种情况下我也会使用 sigmoid 层。
-
然后出现另一个问题:使用 loss='categorical_crossentropy' 会给出足够的结果吗?
标签: keras conv-neural-network mnist softmax