【发布时间】:2011-02-05 07:52:29
【问题描述】:
我得到了廉价相机制作的灰度图像,我需要制作一个程序 OCR。 主要问题是噪声或不是文本但它们存在于二进制图像中的对象。 现在我想到了从图像中提取文本。
我需要一些好的算法。 你能推荐一个非常好的吗? 例如,如果图像包含黑色文本和类似黑线的东西 那么该算法将只选择没有行的文本。
【问题讨论】:
-
OCR 已经有一段时间了。您有什么理由需要构建自己的,而不是寻找现有的工具?至于算法,我相信有很多。通常,您需要有要搜索的字符的现有模板,然后让程序查看图像中是否存在这些模板。
-
如果图像包含清晰的文本,即使手写文本的 ocr 对这些图像也不是很好,其他工具也可以工作。我试过 tesseract google,gocr。字符模板是什么意思?
-
@maxiumus:OCR 系统需要一些参考点,它需要知道正确的“A”是什么样子才能识别出可能是“A”的图像”。实现这一目标的方法可能不止一种,所建议的只是其中一种方法。
标签: algorithm image-processing ocr