【问题标题】:How to pad an array of images with a given color without a for loop?如何在没有 for 循环的情况下填充具有给定颜色的图像数组?
【发布时间】:2020-02-02 18:49:48
【问题描述】:

我有一个 numpy 图像数组,其中包含 numpy 图像数组,我试图用给定的颜色填充数组中的每个图像,而不使用 for 循环。换句话说,我希望一切都矢量化。

为了产生错误:取消注释注释行并注释它下面的注释,你会得到 ValueError: 操作数不能与重新映射的形状一起广播 [original->remapped]: (3,) 和请求的形状 (4 ,2)

您可以使用此图像进行测试。

这是我所做的:

import cv2
import numpy as np
import matplotlib.pyplot as plt


def pad_image(image, pad_width, values, mode='img_arr'):
    """
    Add a pad(border) of a given width and value to the image.
    Args:
        image: Image array or a single image.
        pad_width: The width of the pad.
        values: Value of the pad layer.
        mode: A string representation of the input
            'img_arr': Array of images.
            'img': A single image.

    Return:
        numpy array of padded images or a padded image.
    """
    if mode == 'img_arr':
        # The following commented line will give an error if constant_values is an RGB tuple.
        # return np.pad(
        #     image, ((0, 0), (pad_width, pad_width), (pad_width, pad_width), (0, 0)), constant_values=values)
        return np.array([cv2.copyMakeBorder(
            img, pad_width, pad_width, pad_width, pad_width, cv2.BORDER_CONSTANT, value=values)
            for img in image])
    if mode == 'img':
        return cv2.copyMakeBorder(
            image, pad_width, pad_width, pad_width, pad_width, cv2.BORDER_CONSTANT, value=values)


if __name__ == '__main__':
    tiger = cv2.imread('tiger.jpeg')
    tiger_arr_test = np.array([tiger for i in range(1000)])
    pad_width = 5
    color = (255, 0, 0)
    padded_arr = pad_image(tiger_arr_test, pad_width, color)
    plt.imshow(padded_arr[0])
    plt.title(f'First padded image of the array of images.')
    plt.show()
    padded_single = pad_image(tiger, pad_width, color, 'img')
    print(padded_single.shape)
    plt.imshow(padded_single)
    plt.title('Padded single image.')
    plt.show()

【问题讨论】:

  • 出了什么问题?
  • @wwii 因为我想摆脱 for 循环,取消注释注释行并注释它下面的行,你会得到 ValueError: operands could not be broadcast together with remapped shapes [original->重新映射]:(3,) 和请求的形状 (4,2)

标签: python python-3.x numpy cv2


【解决方案1】:

这是一种不使用numpy.pad的方法

import cv2
import numpy as np
tiger = cv2.imread('tiger.jpg')
tigers = np.array((tiger,tiger,tiger,tiger,tiger))

color = np.array((255, 0, 0))
pad = 5
sub = slice(pad,-pad)

使用原始形状制作一个边框颜色数组

z,a,b,c = tigers.shape
newshape = (z, pad+a+pad, pad+b+pad, c)
w = np.zeros(newshape,dtype=np.uint8) + color

然后只需将原始数组分配到新数组的中间

w[:,sub,sub,:] = tigers

plt.imshow(w[3])
plt.show()
plt.close()

使用numpy.pad - 用零填充,然后将颜色分配给四个边缘

q = np.pad(tigers,((0,0),(pad,pad),(pad,pad),(0,0)))
q[:,:,:5,:] = color
q[:,:,-5:,:] = color
q[:,:5,:,:] = color
q[:,-5:,:,:] = color

numpy.pad 并使用布尔掩码分配颜色

q = np.pad(tigers,((0,0),(pad,pad),(pad,pad),(0,0)))
mask = np.ones(q.shape[:-1],dtype=np.bool8)
mask[:,sub,sub] = False
q[mask] = color

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-12-02
    • 1970-01-01
    • 2021-11-18
    • 2014-02-19
    • 2021-01-29
    • 1970-01-01
    相关资源
    最近更新 更多