【发布时间】:2020-06-04 11:53:11
【问题描述】:
我正在尝试执行以下操作:
所有符号都是数字,除了最顶部字段中的第一个是字母。
问题是我尝试了 tessaract 和 google ml OCR,但结果很差,可能是因为它是单元格中的单个符号,而不是普通文本。我不知道。
所以我决定试试我自己的简单识别模块。
a) 然后我将其转换为灰度和黑白
b) 不幸的是,不能保证每次都在完全相同的位置。由于扫描/照片,它们的尺寸也不相同。
所以我动态地尝试查找字段的位置。 但是在我收到的测试照片上,没有保证线条是直的。 此外,扫描/拍摄的分辨率并不总是相同。
如果有人可以就以下问题给我建议,那就太好了:
动态查找字段。 (目前我的成功率约为 50%,具体取决于照片)
如何处理非直线。
如何检测单个单元格内容/符号。
识别单个符号/数字的好方法/(比较来源等)
也许是更好的黑白转换,而不是简单的阈值。
【问题讨论】: