【问题标题】:How to train CNN with an RGB Image如何使用 RGB 图像训练 CNN
【发布时间】:2017-02-20 00:30:12
【问题描述】:

我目前正在构建一个 CNN 来区分烂苹果和正常苹果。我觉得如果我可以为 CNN 提供 rgb 图像,那将是非常有益的。但是,我究竟需要更改为以下网络吗?

 x = tf.placeholder('float', [None, 784])
#y = tf.placeholder(tf.float32, shape=(), name="init")
y = tf.placeholder('int32')

keep_rate = 0.8
keep_prob = tf.placeholder(tf.float32)

def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1,1,1,1], padding='SAME')

def maxpool2d(x):
    #                        size of window         movement of window
    return tf.nn.max_pool(x, ksize=[1,2,2,1], strides=[1,2,2,1], padding='SAME')



def convolutional_neural_network(x):
    weights = {'W_conv1':tf.Variable(tf.random_normal([5,5,1,32])),
               'W_conv2':tf.Variable(tf.random_normal([5,5,32,64])),
               'W_fc':tf.Variable(tf.random_normal([7*7*64,1024])),
               'out':tf.Variable(tf.random_normal([1024, n_classes]))}

    biases = {'b_conv1':tf.Variable(tf.random_normal([32])),
               'b_conv2':tf.Variable(tf.random_normal([64])),
               'b_fc':tf.Variable(tf.random_normal([1024])),
               'out':tf.Variable(tf.random_normal([n_classes]))}

    x = tf.reshape(x, shape=[-1, 28, 28, 1])

    print("test")
    print(x)
    conv1 = tf.nn.relu(conv2d(x, weights['W_conv1']) + biases['b_conv1'])
    conv1 = maxpool2d(conv1)

    conv2 = tf.nn.relu(conv2d(conv1, weights['W_conv2']) + biases['b_conv2'])
    conv2 = maxpool2d(conv2)

    fc = tf.reshape(conv2,[-1, 7*7*64])
    fc = tf.nn.relu(tf.matmul(fc, weights['W_fc'])+biases['b_fc'])
    fc = tf.nn.dropout(fc, keep_rate)

    output = tf.matmul(fc, weights['out'])+biases['out']
    return output

我尝试更改某些值,但是我不断收到一个又一个错误。该网络目前旨在拍摄 28 x 28 通道 1 灰度图像。

【问题讨论】:

    标签: machine-learning tensorflow neural-network conv-neural-network


    【解决方案1】:

    灰度图像和 RGB 图像之间的唯一区别是波段数,分别为 1 和 3。

    因此,您的 CNN 必须将 3 个波段作为输入,而不是 1 个。其余的将被处理。

    不让你的代码运行,你至少需要改变:

    weights = {'W_conv1':tf.Variable(tf.random_normal([5,5,3,32]))
    x = tf.reshape(x, shape=[-1, 28, 28, 3])
    

    【讨论】:

    • 我是否也应该将我的 maxpool 函数中的步幅和 k 大小的第四个值更改为 3,因为现在颜色通道值为 3?
    • 完成。至于您的问题,您只需要更改输入维度即可。如果没有,问题出在其他地方
    • 谢谢!那成功了。然而,为什么我们不改变步幅张量的第四个输入呢?
    • 我不知道您的实现,但跨度是用于窗口在图像上滑动,而不是在其条带上滑动。这是两个不同的东西。你应该阅读这个网站:cs231n.github.io
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2018-03-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-22
    • 2016-08-23
    • 2021-06-16
    • 1970-01-01
    相关资源
    最近更新 更多