【发布时间】:2020-05-19 21:24:51
【问题描述】:
我的屏幕图像由一些数字值组成。我想通过 Tesseract 4.0 识别这些数字。但是,这些数字由虚线组成,例如七段显示器的虚线。由于破折号,Tesseract 无法识别这些值。我使用 Gimp 并将这些虚线连接成一个部分。 Tesseract 几乎可以正确识别值。我想用 OpenCV 做到这一点。如何将数字的虚线连接成一块?
【问题讨论】:
-
对图像设置阈值以使其变为黑色/白色。这应该有助于 tesseract。
-
谢谢。它有帮助,但如果我设置固定阈值,其他图像会失败。我怎样才能让它自适应?实际上我正在使用 YOLO 从图像中提取屏幕区域。我的计划是预处理那些提取的屏幕区域以提供 Tesseract。显然,这个预处理步骤会对我的数据管道产生不良影响。
-
尝试 Otsu 阈值法或自适应阈值法
标签: python opencv image-processing tesseract text-recognition