【问题标题】:Tensorflow cnn error: logits and labels must be same size:Tensorflow cnn 错误:logits 和标签必须相同大小:
【发布时间】:2016-10-14 16:35:11
【问题描述】:

我正在尝试使用 Tensorflow 创建一个 CNN,将图像分类为 16 个类

我的原始图像大小是 72x72x1,我的网络结构如下:

# Network
n_input  = dim  
n_output = nclass  # 16
weights  = {
    'wc1': tf.Variable(tf.random_normal([5, 5, 1, 32], stddev=0.1)),
    'wc2': tf.Variable(tf.random_normal([5, 5, 32, 64], stddev=0.1)),
    'wd1': tf.Variable(tf.random_normal([9*9*128, 1024], stddev=0.1)),
    'wd2': tf.Variable(tf.random_normal([1024, n_output], stddev=0.1))
}
biases   = {
    'bc1': tf.Variable(tf.random_normal([32], stddev=0.1)),
    'bc2': tf.Variable(tf.random_normal([64], stddev=0.1)),
    'bd1': tf.Variable(tf.random_normal([1024], stddev=0.1)),
    'bd2': tf.Variable(tf.random_normal([n_output], stddev=0.1))
}

这是我的卷积网络函数:

def conv_basic(_input, _w, _b, _keepratio):
# Input
_input_r = tf.reshape(_input, shape=[-1, 72, 72, 1])

# Conv1
_conv1 = tf.nn.relu(tf.nn.bias_add(
        tf.nn.conv2d(_input_r, _w['wc1'], strides=[1, 1, 1, 1], padding='SAME')
        , _b['bc1']))
_pool1 = tf.nn.max_pool(_conv1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
mean, var = tf.nn.moments(_pool1, [0, 1, 2])
_pool1 = tf.nn.batch_norm_with_global_normalization(_pool1, mean, var, 1., 0., 1e-7, 0)
_pool_dr1 = tf.nn.dropout(_pool1, _keepratio)

# Conv2
_conv2 = tf.nn.relu(tf.nn.bias_add(
        tf.nn.conv2d(_pool_dr1, _w['wc2'], strides=[1, 1, 1, 1], padding='SAME')
        , _b['bc2']))
_pool2 = tf.nn.max_pool(_conv2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
mean, var = tf.nn.moments(_pool2, [0, 1, 2])
_pool2 = tf.nn.batch_norm_with_global_normalization(_pool2, mean, var, 1., 0., 1e-7, 0)
_pool_dr2 = tf.nn.dropout(_pool2, _keepratio)

# Vectorize
_dense1 = tf.reshape(_pool_dr2, [-1, _w['wd1'].get_shape().as_list()[0]])

# Fc1
_fc1 = tf.nn.relu(tf.add(tf.matmul(_dense1, _w['wd1']), _b['bd1']))
_fc_dr1 = tf.nn.dropout(_fc1, _keepratio)

# Fc2
_out = tf.add(tf.matmul(_fc_dr1, _w['wd2']), _b['bd2'])

# Return everything
out = {
    'input_r': _input_r,
    'conv1': _conv1,
    'pool1': _pool1,
    'pool1_dr1': _pool_dr1,
    'conv2': _conv2,
    'pool2': _pool2,
    'pool_dr2': _pool_dr2,
    'dense1': _dense1,
    'fc1': _fc1,
    'fc_dr1': _fc_dr1,
    'out': _out
}
return out

当我尝试运行它时,我得到一个错误:"tensorflow.python.framework.errors.InvalidArgumentError: logits and labels must be same size: logits_size=[6,16] labels_size=[1,16]"

上线cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(_pred, y))

我试过改变 wd1 的权重值,除了说请求的形状需要 xxx 的倍数之外,它只是改变了括号中的值。

这些值(尤其是 6)看起来非常随意,不知道它们是从哪里来的。有人向我解释如何选择 FC 层神经元数量会很好,因为这似乎也有点武断。

谢谢

编辑:我的完整代码https://gist.github.com/EricZeiberg/f0b138d859b9ed00ce045dc6b341e0a7

【问题讨论】:

    标签: python neural-network tensorflow conv-neural-network


    【解决方案1】:

    很难从您提供的内容中分辨出来,但似乎您以 6 的批大小提供输入,但只为它们提供一个标签。您的数据来自哪里?

    【讨论】:

      【解决方案2】:

      鉴于您的代码(并猜测其中缺少什么),我认为您有这些参数和结果(如果错误,请纠正我):

      • batch_size: 1
      • num_classes:16
      • 标签y:输入int,形状[batch_size, 1]
      • 输出_pred:类型float32,应该是形状[batch_size, num_classes]

      在您的代码中,您只使用了 2 个最大池化,这会将输入特征图从 [1, 72, 72, 1] 减少到 [1, 18, 18, 64]

      在这一步,你应该写:

      # Vectorize
      _dense1 = tf.reshape(_pool_dr2, [1, 18*18*64])
      

      您还应该将矩阵 wd1 替换为:

      'wd1': tf.Variable(tf.random_normal([18*18*64, 1024], stddev=0.1))
      

      一般在这些情况下,您需要逐个打印每个形状,并自己实现哪些形状与您的期望不符。

      【讨论】:

      • 在尝试您的代码后,它现在显示“ValueError: Cannot feed value of shape (1, 16) for Tensor u'Reshape_3:0', which has shape '(1,)''跨度>
      • 哦,还有,我的批量大小为 1,num_classes 为 16
      猜你喜欢
      • 2016-04-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-01-12
      • 1970-01-01
      • 1970-01-01
      • 2016-08-12
      相关资源
      最近更新 更多