【问题标题】:Fastest method for determining if 2 (vertically or horizontally) adjacent elements of a numpy array have the same value确定numpy数组的2个(垂直或水平)相邻元素是否具有相同值的最快方法
【发布时间】:2018-04-15 11:50:37
【问题描述】:

我正在寻找确定 2 个(垂直或水平)相邻元素是否具有相同值的最快方法。

假设我有一个大小为 4x4 的 numpy 数组。

array([             
[8, 7, 4, 3],    
[8, 4, 0, 4],          
[3, 2, 2, 1],              
[9, 8, 7, 6]])

我希望能够识别出第一列有两个相邻的 8,第三行有两个相邻的 2。我可以对支票进行硬编码,但这会很难看,我想知道是否有更快的方法。

感谢所有指导。谢谢。

【问题讨论】:

  • 你希望这会输出什么?第 1 栏;第 3 行?
  • 我只想要一个是否存在水平或垂直邻接的二进制输出。
  • 发布的解决方案是否对您有用?考虑接受一个?

标签: python arrays numpy multidimensional-array scipy


【解决方案1】:

我们将在行和列中寻找差异值,以便 zeros 在那里发出重复的信号。因此,我们可以这样做 -

(np.diff(a,axis=0) == 0).any() | (np.diff(a,axis=1) == 0).any()

或者使用slicing 来提升性能 -

(a[1:] == a[:-1]).any() | (a[:,1:] == a[:,:-1]).any()

所以,(a[1:] == a[:-1]).any() 是垂直邻接,而另一个是水平邻接。

沿行或列扩展到n 相邻的(相同值) -

from scipy.ndimage.filters import convolve1d as conv

def vert_horz_adj(a, n=1):
    k = np.ones(n,dtype=int)
    v = (conv((a[1:]==a[:-1]).astype(int),k,axis=0,mode='constant')>=n).any()
    h = (conv((a[:,1:]==a[:,:-1]).astype(int),k,axis=1,mode='constant')>=n).any()
    return v | h

示例运行 -

In [413]: np.random.seed(0)
     ...: a = np.random.randint(11,99,(10,4))
     ...: a[[2,3,4,6,7,8],0] = 1

In [414]: a
Out[414]: 
array([[55, 58, 75, 78],
       [78, 20, 94, 32],
       [ 1, 98, 81, 23],
       [ 1, 76, 50, 98],
       [ 1, 92, 48, 36],
       [88, 83, 20, 31],
       [ 1, 80, 90, 58],
       [ 1, 93, 60, 40],
       [ 1, 30, 25, 50],
       [43, 76, 20, 68]])

In [415]: vert_horz_adj(a, n=1)
Out[415]: True  # Because of first col

In [416]: vert_horz_adj(a, n=2)
Out[416]: True  # Because of first col

In [417]: vert_horz_adj(a, n=3)
Out[417]: False

In [418]: a[-1] = 10

In [419]: vert_horz_adj(a, n=3)
Out[419]: True  # Because of last row

【讨论】:

  • +1 我之前看过很棒的切片移位技巧,并认为它非常聪明,但忘记了是否适合这种 完美 情况
  • 您的“n 个相邻的”实际上是“n-1 对相邻的”。这不是一回事 - 11100111 只有三个相邻的,但您声称有 4 个。
  • 当然vert_horz_adj(a, n=3) 应该是True,因为有3 个1s?但除此之外,很好的解决方案。你可以在这里使用np.convolve而不是拉入scipy(只需让内核(1,n)然后(n,1)
【解决方案2】:

您可以使用以下代码找到对的坐标:

import numpy as np
a = np.array([             
[8, 7, 4, 3],    
[8, 4, 0, 4],          
[3, 2, 2, 1],              
[9, 8, 7, 6]])

vertical = np.where((a == np.roll(a, 1, 0))[1:-1])
print(vertical) # (0,0)  is the coordinate of the first of the repeating 8's
horizontal = np.where((a == np.roll(a, 1, 1))[:, 1:-1])
print(horizontal) # (2,1)  is the coordinate of the first of the repeating 2's 

返回

(array([0], dtype=int64), array([0], dtype=int64))
(array([2], dtype=int64), array([1], dtype=int64))

【讨论】:

    【解决方案3】:

    如果你想定位每对的第一次出现:

    A=array([             
    [8, 7, 4, 3],    
    [8, 4, 0, 4],          
    [3, 2, 2, 1],              
    [9, 8, 7, 6]])
    
    x=(A[1:]==A[:-1]).nonzero()
    y=(A[:,1:]==A[:,:-1]).nonzero()
    
    In [45]: x
    Out[45]: (array([0], dtype=int64), array([0], dtype=int64))
    
    
    In [47]: y
    Out[47]: (array([2], dtype=int64), array([1], dtype=int64))
    
    In [48]: A[x]
    Out[48]: array([8])
    
    In [49]: A[y]
    Out[49]: array([2])
    

    xy分别给出了前8个和前2个的位置。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-11-21
      • 2013-06-27
      • 2018-09-16
      相关资源
      最近更新 更多