【发布时间】:2018-11-13 17:05:56
【问题描述】:
我有这个image(一些信息被故意删除)
我需要的是某种去除文本周围边框(线条)的方法。
我正在对这些图像进行 OCR,线条确实妨碍了文本识别。
此外,一切都必须自动运行,当有人上传文档时,OCR 和所有其他脚本都会在服务器端执行。
【问题讨论】:
标签: python image ocr tesseract leptonica
我有这个image(一些信息被故意删除)
我需要的是某种去除文本周围边框(线条)的方法。
我正在对这些图像进行 OCR,线条确实妨碍了文本识别。
此外,一切都必须自动运行,当有人上传文档时,OCR 和所有其他脚本都会在服务器端执行。
【问题讨论】:
标签: python image ocr tesseract leptonica
您可以尝试使用Hough transform 来检测图像中的所有直线,然后您需要做的就是屏蔽它们。
【讨论】:
python process_image.py path/to/image.png)运行它。 See here 了解如何在脚本中使用系统参数。