【问题标题】:MXNET softmax output: label shape confusionMXNET softmax 输出:标签形状混淆
【发布时间】:2018-10-02 15:53:20
【问题描述】:

对于 softmax 分类器的标签应该如何形成,我没有一个清晰的概念。

我可以从我的实验中了解到,指示类概率输出索引的标量标签是一种选择,而另一种是二维标签,其中行是类概率或单热编码变量,如 c(1 , 0, 0)。

让我困惑的是:

  • 我可以使用超出索引的标量标签值,例如我的 4 下面的例子——没有警告或错误。这是为什么呢?
  • 当我的标签是负标量或具有负值的数组时, 该模型收敛到类的均匀概率分布。 例如,这是否预期 actor_train.y = matrix(c(0, -1,v0), ncol = 1) 在 softmax 输出中产生相等的概率?
  • 我尝试使用 softmax MXNET 分类器来产生策略梯度 重新学习,我的负面奖励导致了这个问题 上图:均匀概率。这是预期的吗?

    要求(mxnet)

    actor_initializer

    actor_nn_data

    device.cpu

    神经网络架构

    actor_fc3

    actor_output

    crossentfunc

    actor_loss

    初始化神经网络

    actor_train.x

    actor_train.y = 0 #1 #2 #3 #-3 # 矩阵(c(0, 0, -1), ncol = 1)

    rm(actor_model)

    actor_model

    预测(actor_model, actor_train.x, array.layout = "rowmajor")

【问题讨论】:

    标签: r mxnet softmax


    【解决方案1】:

    这对我来说很奇怪,但我找到了解决方案。

    我将优化器从 optimizer = 'adam' 更改为 optimizer = 'rmsprop',在出现负目标的情况下,NN 开始按预期收敛。我使用简单的 NN 和 optim 函数在 R 中进行了模拟,以获得相同的结果。

    看起来adamSGD 在多项分类的情况下可能是错误的或其他... 987654326@ 可以!请注意!

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-01-23
      • 2012-11-12
      • 1970-01-01
      相关资源
      最近更新 更多