【发布时间】:2020-04-16 18:40:03
【问题描述】:
我正在开发一个应用程序,您可以在其中拍摄设备照片并存储信息。然而,由于设备使用七段显示器/LCD,我很难获得好的结果。
我使用过 Firebase OCR、Google Vision ML Kit 和 Tesseract (Tess-two)。
它们中的每一个都提供了糟糕的结果,尤其是考虑到我已经训练和微调它以识别 3 种类型的七段字体到 0.09 错误率的 Tesseract。
我也尝试过使用其他人的训练数据,例如letsgodigital
我已将图像转换为灰度,然后将其二值化,我也仅将数字列入白名单,但仍无法正确检测文本。我还能做些什么来改善结果?
下面的结果都是正方体。
【问题讨论】:
-
很抱歉,您能否给我用于“将图像转换为灰度然后对其进行二值化”的代码
标签: android ocr tesseract google-vision seven-segment-display