识别扫描/拍摄文档上的符号

【问题标题】：Recognize symbols on a scanned/shot document识别扫描/拍摄文档上的符号
【发布时间】：2020-06-04 11:53:11
【问题描述】：

我正在尝试执行以下操作：

鉴于：扫描/拍摄文档 - 由许多不同程序填写的表格。我试图只识别一小部分数据。如此处所示：

所有符号都是数字，除了最顶部字段中的第一个是字母。

问题是我尝试了 tessaract 和 google ml OCR，但结果很差，可能是因为它是单元格中的单个符号，而不是普通文本。我不知道。
所以我决定试试我自己的简单识别模块。

a) 然后我将其转换为灰度和黑白

b) 不幸的是，不能保证每次都在完全相同的位置。由于扫描/照片，它们的尺寸也不相同。

所以我动态地尝试查找字段的位置。但是在我收到的测试照片上，没有保证线条是直的。此外，扫描/拍摄的分辨率并不总是相同。

如果有人可以就以下问题给我建议，那就太好了：

动态查找字段。（目前我的成功率约为 50%，具体取决于照片）
如何处理非直线。
如何检测单个单元格内容/符号。
识别单个符号/数字的好方法/（比较来源等）
也许是更好的黑白转换，而不是简单的阈值。

【问题讨论】：

不确定这是否有帮助，但你应该看看这些：stackoverflow.com/questions/51119801/detect-corners-of-grid stackoverflow.com/questions/48954246/…

标签： algorithm ocr

【解决方案1】：

在识别前尝试去除数字周围的矩形框。通过关闭/打开等形态学操作，可以关闭图片底部的边框，从而节省数字。

convert input.jpg  -threshold 90% -fuzz 25% -fill black -floodfill +0+0 white -fill white -floodfill +0+0 black out.png

【讨论】：

猜你喜欢

2010-10-14
1970-01-01
1970-01-01
2019-01-22
2020-11-13
1970-01-01
1970-01-01
2010-11-23
1970-01-01

相关资源

下载 2023-01-10
下载 2022-12-25
下载 2021-06-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode