【发布时间】:2025-11-23 23:55:01
【问题描述】:
是否有可能以某种方式使文档中的所有文本在阈值处理后都是白底黑字。我一直在网上寻找,但我一直无法找到解决方案。我当前的阈值图像是:https://i.ibb.co/Rpqcp7v/thresh.jpg
文档需要由 OCR 读取,为此我需要将当前为黑底白字的区域反转。我该怎么做呢?我当前的代码:
# thresholding
def thresholding(image):
# thresholds the image into a binary image (black and white)
return cv2.threshold(image, 120, 255, cv2.THRESH_BINARY)[1]
【问题讨论】:
-
为什么常规 OCR 不能与您当前的阈值一起工作?图像不应被检测到,因此不应该成为问题?
-
我刚刚注意到经常会读出错误的数据。所以我有几种预处理方法,它最终会选择最高置信度的结果,通常这种方法的结果要好得多。这仍然是我遇到的主要障碍。
-
也许可以试试这个从图像中获取文本,然后运行你的 OCR:*.com/a/54125216/9178557
-
已经尝试过倒置阈值,但它不能解决问题,对吧?除非我能以某种方式组合生成的图像(从每张图像中取出白色背景区域)