图像的文本检测答案

【问题标题】：Text detection of image图像的文本检测
【发布时间】：2011-02-05 07:52:29
【问题描述】：

我得到了廉价相机制作的灰度图像，我需要制作一个程序 OCR。主要问题是噪声或不是文本但它们存在于二进制图像中的对象。现在我想到了从图像中提取文本。

我需要一些好的算法。你能推荐一个非常好的吗？例如，如果图像包含黑色文本和类似黑线的东西那么该算法将只选择没有行的文本。

【问题讨论】：

OCR 已经有一段时间了。您有什么理由需要构建自己的，而不是寻找现有的工具？至于算法，我相信有很多。通常，您需要有要搜索的字符的现有模板，然后让程序查看图像中是否存在这些模板。
如果图像包含清晰的文本，即使手写文本的 ocr 对这些图像也不是很好，其他工具也可以工作。我试过 tesseract google，gocr。字符模板是什么意思？
@maxiumus：OCR 系统需要一些参考点，它需要知道正确的“A”是什么样子才能识别出可能是“A”的图像”。实现这一目标的方法可能不止一种，所建议的只是其中一种方法。
这个问题与stackoverflow.com/questions/1848/locating-text-within-image重复
你可能会看这里：stackoverflow.com/questions/1284214/…

【解决方案1】：

您描述了两种要消除的噪音。（顺便说一句，用于降噪的wikipedia page 还不错，请查看“图像中”部分）。

一种是奇点噪声。这通常被称为“斑点”或“椒盐”噪声，通常被某种平均滤波器去除。 mathworks 有一个很好的页面描述了一些算法。

第二种是线条。这更难，我不会真正将其描述为噪声，它取决于您输入的图像类型。 This paper 似乎很合适，但它不是在线免费提供的，因此您可能需要购买它或去当地的大学图书馆。

你可能还想看看this，它可以从很多地方下载，但它确实是用于电影（视频）的，所以可能不是你想要的。

【讨论】：