如何在没有 for 循环的情况下填充具有给定颜色的图像数组？答案

【问题标题】：How to pad an array of images with a given color without a for loop?如何在没有 for 循环的情况下填充具有给定颜色的图像数组？
【发布时间】：2020-02-02 18:49:48
【问题描述】：

我有一个 numpy 图像数组，其中包含 numpy 图像数组，我试图用给定的颜色填充数组中的每个图像，而不使用 for 循环。换句话说，我希望一切都矢量化。

为了产生错误：取消注释注释行并注释它下面的注释，你会得到 ValueError: 操作数不能与重新映射的形状一起广播 [original->remapped]: (3,) 和请求的形状 (4 ,2)

您可以使用此图像进行测试。

这是我所做的：

import cv2
import numpy as np
import matplotlib.pyplot as plt


def pad_image(image, pad_width, values, mode='img_arr'):
    """
    Add a pad(border) of a given width and value to the image.
    Args:
        image: Image array or a single image.
        pad_width: The width of the pad.
        values: Value of the pad layer.
        mode: A string representation of the input
            'img_arr': Array of images.
            'img': A single image.

    Return:
        numpy array of padded images or a padded image.
    """
    if mode == 'img_arr':
        # The following commented line will give an error if constant_values is an RGB tuple.
        # return np.pad(
        #     image, ((0, 0), (pad_width, pad_width), (pad_width, pad_width), (0, 0)), constant_values=values)
        return np.array([cv2.copyMakeBorder(
            img, pad_width, pad_width, pad_width, pad_width, cv2.BORDER_CONSTANT, value=values)
            for img in image])
    if mode == 'img':
        return cv2.copyMakeBorder(
            image, pad_width, pad_width, pad_width, pad_width, cv2.BORDER_CONSTANT, value=values)


if __name__ == '__main__':
    tiger = cv2.imread('tiger.jpeg')
    tiger_arr_test = np.array([tiger for i in range(1000)])
    pad_width = 5
    color = (255, 0, 0)
    padded_arr = pad_image(tiger_arr_test, pad_width, color)
    plt.imshow(padded_arr[0])
    plt.title(f'First padded image of the array of images.')
    plt.show()
    padded_single = pad_image(tiger, pad_width, color, 'img')
    print(padded_single.shape)
    plt.imshow(padded_single)
    plt.title('Padded single image.')
    plt.show()

【问题讨论】：

出了什么问题？
@wwii 因为我想摆脱 for 循环，取消注释注释行并注释它下面的行，你会得到 ValueError: operands could not be broadcast together with remapped shapes [original->重新映射]：(3,) 和请求的形状 (4,2)

标签： python python-3.x numpy cv2

【解决方案1】：

这是一种不使用numpy.pad的方法

import cv2
import numpy as np
tiger = cv2.imread('tiger.jpg')
tigers = np.array((tiger,tiger,tiger,tiger,tiger))

color = np.array((255, 0, 0))
pad = 5
sub = slice(pad,-pad)

使用原始形状制作一个边框颜色数组

z,a,b,c = tigers.shape
newshape = (z, pad+a+pad, pad+b+pad, c)
w = np.zeros(newshape,dtype=np.uint8) + color

然后只需将原始数组分配到新数组的中间

w[:,sub,sub,:] = tigers

plt.imshow(w[3])
plt.show()
plt.close()

使用numpy.pad - 用零填充，然后将颜色分配给四个边缘

q = np.pad(tigers,((0,0),(pad,pad),(pad,pad),(0,0)))
q[:,:,:5,:] = color
q[:,:,-5:,:] = color
q[:,:5,:,:] = color
q[:,-5:,:,:] = color

numpy.pad 并使用布尔掩码分配颜色

q = np.pad(tigers,((0,0),(pad,pad),(pad,pad),(0,0)))
mask = np.ones(q.shape[:-1],dtype=np.bool8)
mask[:,sub,sub] = False
q[mask] = color

【讨论】：