【发布时间】:2019-11-02 03:49:32
【问题描述】:
屏幕截图上的 tesseract OCR 给出了相当不稳定的结果。即使图像是全黑的,上面有白色的文字,似乎也只有一些文字可以被正确识别。即使在我将图像大小调整为300dpi 之后,准确性仍然很低,并且大部分文本都是乱码。
我在 StackOverflow 上阅读了类似的问题:Best way to recognize characters in screenshot?
如前所述,问题的作者通过使用他的字体训练 tesseract 引擎能够获得近 100% 的准确率。
我图片中的字体是 Arial。我怎样才能提高准确性???
这是我拥有的图像类型的示例: Image Sample
【问题讨论】:
标签: image-processing ocr tesseract training-data