MXNET softmax 输出：标签形状混淆答案

【问题标题】：MXNET softmax output: label shape confusionMXNET softmax 输出：标签形状混淆
【发布时间】：2018-10-02 15:53:20
【问题描述】：

对于 softmax 分类器的标签应该如何形成，我没有一个清晰的概念。

我可以从我的实验中了解到，指示类概率输出索引的标量标签是一种选择，而另一种是二维标签，其中行是类概率或单热编码变量，如 c(1 , 0, 0)。

让我困惑的是：

我可以使用超出索引的标量标签值，例如我的 4 下面的例子——没有警告或错误。这是为什么呢？
当我的标签是负标量或具有负值的数组时，该模型收敛到类的均匀概率分布。例如，这是否预期 actor_train.y = matrix(c(0, -1,v0), ncol = 1) 在 softmax 输出中产生相等的概率？
我尝试使用 softmax MXNET 分类器来产生策略梯度重新学习，我的负面奖励导致了这个问题上图：均匀概率。这是预期的吗？

要求（mxnet）

actor_initializer

actor_nn_data

device.cpu

神经网络架构

actor_fc3

actor_output

crossentfunc

actor_loss

初始化神经网络

actor_train.x

actor_train.y = 0 #1 #2 #3 #-3 # 矩阵(c(0, 0, -1), ncol = 1)

rm(actor_model)

actor_model

预测(actor_model, actor_train.x, array.layout = "rowmajor")

【问题讨论】：

【解决方案1】：

这对我来说很奇怪，但我找到了解决方案。

我将优化器从 optimizer = 'adam' 更改为 optimizer = 'rmsprop'，在出现负目标的情况下，NN 开始按预期收敛。我使用简单的 NN 和 optim 函数在 R 中进行了模拟，以获得相同的结果。

看起来adam 或SGD 在多项分类的情况下可能是错误的或其他... 987654326@ 可以！请注意！

【讨论】：

神经网络架构