【问题标题】:Recognize symbols on a scanned/shot document识别扫描/拍摄文档上的符号
【发布时间】:2020-06-04 11:53:11
【问题描述】:

我正在尝试执行以下操作:

  1. 鉴于: 扫描/拍摄文档 - 由许多不同程序填写的表格。 我试图只识别一小部分数据。如此处所示:

所有符号都是数字,除了最顶部字段中的第一个是字母。

  1. 问题是我尝试了 tessaract 和 google ml OCR,但结果很差,可能是因为它是单元格中的单个符号,而不是普通文本。我不知道。

  2. 所以我决定试试我自己的简单识别模块。

a) 然后我将其转换为灰度和黑白

b) 不幸的是,不能保证每次都在完全相同的位置。由于扫描/照片,它们的尺寸也不相同。

所以我动态地尝试查找字段的位置。 但是在我收到的测试照片上,没有保证线条是直的。 此外,扫描/拍摄的分辨率并不总是相同。

如果有人可以就以下问题给我建议,那就太好了:

  1. 动态查找字段。 (目前我的成功率约为 50%,具体取决于照片)

  2. 如何处理非直线。

  3. 如何检测单个单元格内容/符号。

  4. 识别单个符号/数字的好方法/(比较来源等)

  5. 也许是更好的黑白转换,而不是简单的阈值。

【问题讨论】:

标签: algorithm ocr


【解决方案1】:

在识别前尝试去除数字周围的矩形框。 通过关闭/打开等形态学操作,可以关闭图片底部的边框,从而节省数字。

convert input.jpg  -threshold 90% -fuzz 25% -fill black -floodfill +0+0 white -fill white -floodfill +0+0 black out.png

【讨论】:

    猜你喜欢
    • 2010-10-14
    • 1970-01-01
    • 1970-01-01
    • 2019-01-22
    • 2020-11-13
    • 1970-01-01
    • 1970-01-01
    • 2010-11-23
    • 1970-01-01
    相关资源
    最近更新 更多