使用 Python 进行光学字符识别 - 自动裁剪

【问题标题】：Optical Character Recognition with Python - Auto Cropping使用 Python 进行光学字符识别 - 自动裁剪
【发布时间】：2016-05-31 21:12:26
【问题描述】：

我正在处理各种 OCR 任务，使用 Python 进行预处理并使用 Tesseract 进行分析。

最新的问题是如何裁剪带有图像的图像，例如6 张名片的扫描图像或具有两个不同部分的板的照片。我想把一张图片（.jpg、.png）上的名片变成6张图片。

理想情况下，我想在 Python（R 也是）中执行此操作，但我愿意接受任何和所有建议。谢谢。

【问题讨论】：

【解决方案1】：

通过使用 opencv，您可能能够找到它们的轮廓，就像它们在 their documentation about finding contours 或 here 中所做的那样。

我还写了一个网格检测器，如果你的卡片大小都一样，可能是灵感的来源，如果不是，也可能是灵感的来源...https://github.com/julienpalard/grid-finder

【讨论】：