【发布时间】:2014-09-29 14:56:52
【问题描述】:
我正在尝试使用 Tesseract 3.02 从应用程序中读取文本以进行验证(自动化测试)。如果字体很小(8 到 10),它总是给我不正确的结果。在将图像传递给 tesseract 之前,我遵循了下面提到的图像处理。 1. 将图像转换为灰度。 (图片格式JPG) 2.重新缩放图像 3. 将图像转换为 300 DPI
对图像进行预处理后,将其传递给 tesseract。我拥有的大多数应用程序图像的字体都很小。此外,我确保训练数据中的字体类型可用,但准确率仍然很低。
如果我遗漏了什么,谁能指导我。
【问题讨论】:
-
我在这里发布了一个可能相关的答案:stackoverflow.com/q/21827854/1679849。此外,请勿使用 JPEG 等有损图像格式。请改用 PNG。