【问题标题】:How to make texts in images sharper using PIL?如何使用 PIL 使图像中的文本更清晰?
【发布时间】:2013-03-25 00:57:49
【问题描述】:

我正在使用 PIL、OpenCV 和 OCR 阅读器从图像中读取文本。我面临的最大问题是在图像处理方面使文本足够清晰,以便 OCR 阅读器更轻松/准确地提取。

为此,我想增加对比度/亮度并使用 PIL 进行直方图均衡化,但这也无济于事。

那么,您建议如何使文本看起来更清晰,以便更好地提取文本?

【问题讨论】:

    标签: opencv image-processing python-imaging-library ocr


    【解决方案1】:

    PIL 有sharpen and edge enhancing filters。这是你想要的吗?显示您正在处理的内容的示例图像会很有帮助。

    您的图片背景颜色不均匀,这可能会导致问题。尝试查看this solution 以创建漂亮的水平黑白图像。

    但是黑领也会造成问题,你应该看看如何剪掉它。

    也就是说,我通过一个简单的 PIL SHARPEN 过滤器得到了合理的改进:

    SHARPEN 过滤器后的tesseract 结果:

    从我所学到的观察人的内心,^ 我决定做人 在某些情况下,生物处于“飓风和冰块之间} 尊重,永远神秘,但在其他方面 - 有足够的科学 仔细地探查 认为我们已经达到了人类知识的极限 3 认为我们可以知道一切。还有足够的空间 变得更好,向我什至死去的人提问,向我学习 知道我们的简单确定性何时是错误的。

    没有过滤器的结果:

    从我学到的 lnnkmg wade maple} Fve deculed lunnuan wlng;. 埃尔'。 .y.w.r-a' 是between a luurrlctuvr null llva laAll。'一种。 I ll respects, permanently unyst:-rwntMl ln 毫秒。重新有足够的场景) 和turutul pmlulng l~m.rely scrutable。他会像 loallsla 一样 谢谢我们已经达到了人类知识的极限,因为它可以思考 我们可以知道一切。还有足够的空间可以得到 更好的是,问'甚至死者的问题,向知道什么时候学习 我们简单的确定是错误的。

    【讨论】:

    • 我正在处理从图像中提取文本,例如:distilleryimage5.s3.amazonaws.com/… 我正在使用 Tesseract,但它的准确性非常低,我相信可以通过更好地处理图像来改进,并锐化构成文本的线条。
    • @Hick 查看我的更新。您应该在提交的问题的文本中包含这些额外的详细信息(图像和您使用 Tesseract 的事实)。
    猜你喜欢
    • 1970-01-01
    • 2013-07-26
    • 1970-01-01
    • 1970-01-01
    • 2011-04-18
    • 2020-08-20
    • 1970-01-01
    • 1970-01-01
    • 2016-03-06
    相关资源
    最近更新 更多