【发布时间】:2016-07-26 23:28:21
【问题描述】:
在tf.nn.max_pool的定义中,ksize是干什么用的?
tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None)
Performs the max pooling on the input.
Args:
value: A 4-D Tensor with shape [batch, height, width, channels] and type tf.float32.
ksize: A list of ints that has length >= 4. The size of the window for each dimension of the input tensor.
例如,如果input value 属于tensor : [1, 64, 64, 3] 和ksize=3。这意味着什么?
【问题讨论】:
-
在大小为 ksize(内核大小)的区域上取最大值。
-
根据描述,ksize为输入张量的每个维度捕获窗口的大小。如果批量大小 = 6,ksize=3,这是否意味着对于给定的池化内核,maxmum 将超过 3 个批次?
标签: computer-vision tensorflow