【发布时间】:2015-06-14 12:48:14
【问题描述】:
为了使用 OCR 库 tesseract 获得更好的结果,我会进行一些预处理,但不知道哪些步骤可以帮助我。
我尝试使用因子 15 调整图像大小并应用了调整的阈值(请参阅图像),但这会导致“波浪”字符,无法使用 tesseract OCR 库检测到。在底部,您可以通过 Dropbox 找到我的图片链接。原图尺寸115x18px,字高10px。
我想从背景中提取字符。哪些步骤可以带来更好的结果?我应该为 OCR 部分使用另一个 OCR 库而不是 tesseract 吗?在使用 tesseract 进行文本检测时,您一般有哪些经验?或者您更喜欢其他库还是商业库?
19.6.15 更新:
OTSU 阈值作为自适应阈值可提供更好的结果。将在接下来的几天内提供有关其他答案的更新!
更新 01.07.2015 有另一个示例图像,其中序列号应使用 tesseract 识别。由于字体很小,识别结果不是很好。有什么想法可以在这里提供帮助吗?
【问题讨论】:
-
试试看霍夫变换函数
-
这里有一些脚本可能有用。 fmwconcepts.com/imagemagick
标签: c++ opencv image-processing ocr tesseract