【发布时间】:2018-07-11 11:23:49
【问题描述】:
为了提高 OCR 质量,我需要对扫描的图像进行预处理。有时我需要对带有少量图片(页面上的组件并且它们处于不同角度 - 例如,一次扫描的几个纸质文档)的图像进行 OCR,例如:
是否可以以编程方式自动将此类图像划分为包含每个逻辑文档的单独图像?例如使用 ImageMagick 之类的工具或其他工具?有没有针对此类问题的解决方案/技术?
【问题讨论】:
-
如果您有超过 50 张图像和许多不同的图像组合,您可以尝试使用 ML 驱动的解决方案。类似app.nanonets.com/ObjectCategorySelection
-
我使用 OpenCV 进行图像处理。
To seperate the first image, erode, threshold, and findContours, rotate if necessary.然后我得到these detections 和these cropeds。但是图像中的文字太小,无法进行 OCR。您更新后的图像对于图像处理来说更糟糕。 -
这只是一个示例,用于描述问题。原始图像的质量要好一些。
-
@Silencer 你能显示代码吗?
标签: image-processing imagemagick ocr image-preprocessing