来自文档:
OpenCV 有 distanceTransform() 和 distanceTransformWithLabels() 函数,它们的工作方式类似,但与这个 Matlab 函数有一些不同。来自Matlab docs for bwdist:
D = bwdist(BW) 计算二值图像 BW 的欧几里得距离变换。对于BW 中的每个像素,距离变换分配一个数字,该数字是该像素与BW 最近的非零像素之间的距离。
将此与OpenCV docs for distanceTransformWithLabels() 进行比较:
计算源图像的每个像素到最近的零像素的距离。
所以 Matlab 给出了到最近的非零像素的距离,而 OpenCV 给出了到最近的零像素的距离。所以你需要为 OpenCV 反转图像。此外,带有标签的 Matlab 的可选输出给出了对应于最近像素的线性索引:
[D,idx] = bwdist(BW) 还以索引数组idx 的形式计算最近像素图。 idx 的每个元素都包含最近的非零像素BW 的线性索引。最近像素图也称为特征图、特征变换或最近邻变换。
使用 OpenCV,得到输出的标签不是图像的坐标,也不是索引。相反,它只是一个数字标签,类似于连接组件标签,与像素位置/索引完全无关。
该函数的变体不仅计算每个像素的最小距离(x,y),而且还识别由零像素 (labelType==DIST_LABEL_CCOMP) 或最近的零组成的最近连通分量像素 (labelType==DIST_LABEL_PIXEL)。
这意味着您必须使用此标记图像来掩盖您的输入并找到与该标签对应的像素(据我所知,至少这是最好的方法)。
解决方案:
所以只是为了让我们了解如何到达我们想要的地方,让我们看看这个函数将我们带到哪里(如前所述,使用反转图像作为输入):
In [138]: img
Out[138]:
array([[ 0, 0, 0, 0, 0, 0, 0],
[ 0, 255, 0, 0, 0, 0, 0],
[ 0, 0, 0, 0, 0, 255, 0],
[ 0, 0, 0, 0, 0, 0, 0]], dtype=uint8)
In [139]: dist, labels = cv2.distanceTransformWithLabels(~a, distanceType=cv2.DIST_L2, maskSize=3)
In [140]: print(dist)
[[1.3999939 1. 1.3999939 2.1968994 2.1968994 2. 2.1968994]
[1. 0. 1. 2. 1.3999939 1. 1.3999939]
[1.3999939 1. 1.3999939 2. 1. 0. 1. ]
[2.1968994 2. 2.1968994 2.1968994 1.3999939 1. 1.3999939]]
In [141]: print(labels)
[[1 1 1 1 2 2 2]
[1 1 1 1 2 2 2]
[1 1 1 2 2 2 2]
[1 1 1 2 2 2 2]]
好吧,如果我们只是遍历标签中的唯一值,为它们中的每一个创建一个掩码,掩码原始图像......然后找到该标记区域内的白色像素,我们将获得索引:
In [146]: for l in np.unique(labels):
...: mask = label == l
...: i = np.where(img * mask)
...: print(i)
...:
(array([1]), array([1]))
(array([2]), array([5]))
这不是您要求的确切输出,但它是索引列表,并且您有标签。所以现在我们只需要映射这些。我要做的是创建一个空的两通道矩阵来保存索引值,然后根据标签中的掩码填充它:
In [177]: index_img = np.zeros((*img.shape, 2), dtype=np.intp)
In [178]: for l in np.unique(labels):
...: mask = label == l
...: index_img[mask] = np.dstack(np.where(img * mask))
这是一个包含您想要的信息的双通道数组。结构有点不同(不是每个条目都使用元组),但通常是其他 OpenCV 函数想要的结构(双通道数组):
In [204]: index_img[:, :, 0]
Out[204]:
array([[1, 1, 1, 1, 2, 2, 2],
[1, 1, 1, 1, 2, 2, 2],
[1, 1, 1, 2, 2, 2, 2],
[1, 1, 1, 2, 2, 2, 2]])
In [205]: index_img[:, :, 1]
Out[205]:
array([[1, 1, 1, 1, 5, 5, 5],
[1, 1, 1, 1, 5, 5, 5],
[1, 1, 1, 5, 5, 5, 5],
[1, 1, 1, 5, 5, 5, 5]])
把它们放在一起
这是一个执行此操作的函数,并且可以选择输出这两个通道的输出,或者像 Matlab 那样只输出线性输出:
def bwdist(img, metric=cv2.DIST_L2, dist_mask=cv2.DIST_MASK_5, label_type=cv2.DIST_LABEL_CCOMP, ravel=True):
"""Mimics Matlab's bwdist function.
Available metrics:
https://docs.opencv.org/3.4/d7/d1b/group__imgproc__misc.html#gaa2bfbebbc5c320526897996aafa1d8eb
Available distance masks:
https://docs.opencv.org/3.4/d7/d1b/group__imgproc__misc.html#gaaa68392323ccf7fad87570e41259b497
Available label types:
https://docs.opencv.org/3.4/d7/d1b/group__imgproc__misc.html#ga3fe343d63844c40318ee627bd1c1c42f
"""
flip = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY_INV)[1]
dist, labeled = cv2.distanceTransformWithLabels(flip, metric, dist_mask)
# return linear indices if ravel == True (default)
if ravel:
idx = np.zeros(img.shape, dtype=np.intp) # np.intp type is for indices
for l in np.unique(labeled):
mask = labeled == l
idx[mask] = np.flatnonzero(img * mask)
return dist, idx
# return two-channel indices if ravel == False
idx = np.zeros((*img.shape, 2), dtype=np.intp)
for l in np.unique(labeled):
mask = labeled == l
idx[mask] = np.dstack(np.where(img * mask))
return dist, idx
还有 Matlab 在文档中给出的示例:
In [241]: bw = np.zeros((5, 5), dtype=np.uint8)
...: bw[1, 1] = 1
...: bw[3, 3] = 1
...: print(bw)
...:
[[0 0 0 0 0]
[0 1 0 0 0]
[0 0 0 0 0]
[0 0 0 1 0]
[0 0 0 0 0]]
In [244]: d, idx = bwdist(bw)
In [245]: print(d)
[[1.3999939 1. 1.3999939 2.1968994 3.1968994]
[1. 0. 1. 2. 2.1968994]
[1.3999939 1. 1.3999939 1. 1.3999939]
[2.1968994 2. 1. 0. 1. ]
[3.1968994 2.1968994 1.3999939 1. 1.3999939]]
In [246]: print(idx)
[[ 6 6 6 6 18]
[ 6 6 6 6 18]
[ 6 6 6 18 18]
[ 6 6 18 18 18]
[ 6 18 18 18 18]]