【发布时间】:2016-05-31 21:12:26
【问题描述】:
我正在处理各种 OCR 任务,使用 Python 进行预处理并使用 Tesseract 进行分析。
最新的问题是如何裁剪带有图像的图像,例如6 张名片的扫描图像或具有两个不同部分的板的照片。我想把一张图片(.jpg、.png)上的名片变成6张图片。
理想情况下,我想在 Python(R 也是)中执行此操作,但我愿意接受任何和所有建议。谢谢。
【问题讨论】:
我正在处理各种 OCR 任务,使用 Python 进行预处理并使用 Tesseract 进行分析。
最新的问题是如何裁剪带有图像的图像,例如6 张名片的扫描图像或具有两个不同部分的板的照片。我想把一张图片(.jpg、.png)上的名片变成6张图片。
理想情况下,我想在 Python(R 也是)中执行此操作,但我愿意接受任何和所有建议。谢谢。
【问题讨论】:
通过使用 opencv,您可能能够找到它们的轮廓,就像它们在 their documentation about finding contours 或 here 中所做的那样。
我还写了一个网格检测器,如果你的卡片大小都一样,可能是灵感的来源,如果不是,也可能是灵感的来源...https://github.com/julienpalard/grid-finder
【讨论】: