【问题标题】:What does the filter parameter mean in Conv2d layer?Conv2d层中的filter参数是什么意思?
【发布时间】:2021-05-07 17:05:54
【问题描述】:

我对过滤器参数感到困惑,它是 keras 中 Conv2D() 层函数中的第一个参数。据我了解,过滤器应该执行诸如边缘检测或锐化图像或模糊图像之类的操作,但是当我将模型定义为时

input_shape = (32, 32, 3)
model = Sequential()
model.add( Conv2D(64, kernel_size=(5, 5), activation='relu', input_shape=input_shape, strides=(1,1), padding='same') )
model.add(MaxPooling2D(pool_size=(2, 2), strides=(2,2)))
model.add(Conv2D(64, kernel_size=(5, 5), activation='relu', input_shape=input_shape, strides=(1,1), padding='same'))
model.add(MaxPooling2D(pool_size=(2, 2), strides=(2,2)))
model.add(Conv2D(128, kernel_size=(5, 5), activation='relu', input_shape=input_shape, strides=(1,1), padding='same'))
model.add(Flatten())
model.add(Dense(3072, activation='relu'))
model.add(Dense(2048, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))

我没有提到 Conv2D 函数中任何地方的边缘检测或模糊或锐化。输入图像是 32 x 32 RGB 图像。

所以我的问题是,当我将卷积层定义为Conv2D(64, ...) 时,这 64 是否意味着 64 种不同类型的过滤器,例如由 keras 随机选择的垂直边缘、水平边缘等?如果是这样,那么卷积层(具有 64 个滤波器和 5x5 内核和 1x1 步幅)在 32x32 1 通道图像上的输出是 64 个 28x28 大小的图像。如何将这 64 幅图像组合成一张图像以供更多层使用?

【问题讨论】:

    标签: python tensorflow keras deep-learning conv-neural-network


    【解决方案1】:

    filters 参数设置该层中卷积滤波器的数量。这些过滤器使用kernel_initializer 参数指定的方法初始化为小的随机值。在网络训练期间,过滤器以最小化损失的方式更新。所以在训练过程中,过滤器会学习检测某些特征,比如边缘和纹理,它们可能会变成下图(来自here)。

    认识到一个人不会手工制作过滤器是非常重要的。这些是在训练过程中自动学习的——这就是深度学习的美妙之处。

    我强烈建议您阅读一些深度学习资源,尤其是 https://cs231n.github.io/convolutional-networks/https://www.youtube.com/watch?v=r5nXYc2wYvI&list=PLypiXJdtIca5sxV7aE3-PS9fYX3vUdIOX&index=3&t=3122s

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-05-06
      • 2016-10-17
      • 2012-07-07
      • 1970-01-01
      • 1970-01-01
      • 2013-07-07
      • 2014-02-18
      相关资源
      最近更新 更多