【发布时间】:2014-06-05 15:11:14
【问题描述】:
我正在尝试对图像中的 ASCII 字符串进行 OCR 识别。我正在使用 Tesseract3 库,但我在正确识别方面遇到了一点问题,所以我需要用新的字符集(这是特定的)来训练它。 我已经发现了这个 HOW-TO:TrainingTesseract3,但是由于我的图像测试集的简单性,本教程有一些我不需要的不必要的过程。 我的图像数据集仅包含 1 行,其中每个 ASCII 字符在所有图像中都是 相同(无旋转、无缩放),但具有可变距离(仅水平) 行中的字符之间。
如何使用字体图像来训练识别算法?
【问题讨论】:
标签: pattern-matching ascii ocr tesseract training-data