【问题标题】:Character segmentation of an image with overlapping parts具有重叠部分的图像的字符分割
【发布时间】:2019-04-12 17:32:27
【问题描述】:

我尝试使用重叠字符分割验证码,但根本没有任何效果。

我已经阅读了一些关于字符分割的文章,并尝试实现一种算法,按列对像素求和并找到应该构成不同字符开始的局部最小值。但是,该算法不起作用,因为字符非常倾斜。

我也试图消除重叠,但它最终完全侵蚀了文本的重要部分。

这里有一些例子:

img = cv.imread('captcha.png')
cv.threshold(img, 127, 255, cv.THRESH_BINARY_INV)
gray = FindDividingCols(gray)
### algo for summing over pixels and finding local minima:
col_pix = np.apply_along_axis(lambda row: np.sum(row)//255, 0, img)
loc_min = np.r_[True, lst[1:] < lst[:-1]] & np.r_[lst[:-1] < lst[1:],True]

我想知道我错过了什么,或者还有哪些其他的细分方式?

【问题讨论】:

    标签: python ocr captcha


    【解决方案1】:

    如果你真的想要并且需要将这些严重扭曲的字母分割成不同的字符分割输入以便检测神经网络,那么最好的(我认为唯一的方法)是通过相同的神经网络将它们分割成不同的实体。所以你最终会拥有 2 个神经网络

    1- 用于分割

    2-用于检测

    【讨论】:

      【解决方案2】:

      这些验证码被故意扭曲以使 OCR 算法很难读取它们。如果它相当容易做到,那么验证码将毫无意义。因此,您可能有一个需要大量研究和工作才能解决的问题;我认为 Stack Overflow 不会轻易提供答案(如果确实如此,验证码会变得更难);)

      【讨论】:

        猜你喜欢
        • 2019-09-26
        • 1970-01-01
        • 2011-08-29
        • 1970-01-01
        • 2014-04-11
        • 2014-12-03
        • 2020-12-05
        • 2014-07-31
        • 2018-11-18
        相关资源
        最近更新 更多