【发布时间】:2018-10-02 15:53:20
【问题描述】:
对于 softmax 分类器的标签应该如何形成,我没有一个清晰的概念。
我可以从我的实验中了解到,指示类概率输出索引的标量标签是一种选择,而另一种是二维标签,其中行是类概率或单热编码变量,如 c(1 , 0, 0)。
让我困惑的是:
- 我可以使用超出索引的标量标签值,例如我的 4 下面的例子——没有警告或错误。这是为什么呢?
- 当我的标签是负标量或具有负值的数组时,
该模型收敛到类的均匀概率分布。
例如,这是否预期
actor_train.y = matrix(c(0, -1,v0), ncol = 1)在 softmax 输出中产生相等的概率? -
我尝试使用 softmax MXNET 分类器来产生策略梯度 重新学习,我的负面奖励导致了这个问题 上图:均匀概率。这是预期的吗?
要求(mxnet)
actor_initializer
actor_nn_data
device.cpu
神经网络架构
actor_fc3
actor_output
crossentfunc
actor_loss
初始化神经网络
actor_train.x
actor_train.y = 0 #1 #2 #3 #-3 # 矩阵(c(0, 0, -1), ncol = 1)
rm(actor_model)
actor_model
预测(actor_model, actor_train.x, array.layout = "rowmajor")
【问题讨论】: