【发布时间】:2013-03-25 00:57:49
【问题描述】:
我正在使用 PIL、OpenCV 和 OCR 阅读器从图像中读取文本。我面临的最大问题是在图像处理方面使文本足够清晰,以便 OCR 阅读器更轻松/准确地提取。
为此,我想增加对比度/亮度并使用 PIL 进行直方图均衡化,但这也无济于事。
那么,您建议如何使文本看起来更清晰,以便更好地提取文本?
【问题讨论】:
标签: opencv image-processing python-imaging-library ocr
我正在使用 PIL、OpenCV 和 OCR 阅读器从图像中读取文本。我面临的最大问题是在图像处理方面使文本足够清晰,以便 OCR 阅读器更轻松/准确地提取。
为此,我想增加对比度/亮度并使用 PIL 进行直方图均衡化,但这也无济于事。
那么,您建议如何使文本看起来更清晰,以便更好地提取文本?
【问题讨论】:
标签: opencv image-processing python-imaging-library ocr
PIL 有sharpen and edge enhancing filters。这是你想要的吗?显示您正在处理的内容的示例图像会很有帮助。
您的图片背景颜色不均匀,这可能会导致问题。尝试查看this solution 以创建漂亮的水平黑白图像。
但是黑领也会造成问题,你应该看看如何剪掉它。
也就是说,我通过一个简单的 PIL SHARPEN 过滤器得到了合理的改进:
SHARPEN 过滤器后的tesseract 结果:
从我所学到的观察人的内心,^ 我决定做人 在某些情况下,生物处于“飓风和冰块之间} 尊重,永远神秘,但在其他方面 - 有足够的科学 仔细地探查 认为我们已经达到了人类知识的极限 3 认为我们可以知道一切。还有足够的空间 变得更好,向我什至死去的人提问,向我学习 知道我们的简单确定性何时是错误的。
没有过滤器的结果:
从我学到的 lnnkmg wade maple} Fve deculed lunnuan wlng;. 埃尔'。 .y.w.r-a' 是
between a luurrlctuvr null llva laAll。'一种。I ll respects, permanently unyst:-rwntMl ln 毫秒。重新有足够的场景) 和turutul pmlulng l~m.rely scrutable。他会像 loallsla 一样 谢谢我们已经达到了人类知识的极限,因为它可以思考 我们可以知道一切。还有足够的空间可以得到 更好的是,问'甚至死者的问题,向知道什么时候学习 我们简单的确定是错误的。
【讨论】: