【问题标题】:Text detection of image图像的文本检测
【发布时间】:2011-02-05 07:52:29
【问题描述】:

我得到了廉价相机制作的灰度图像,我需要制作一个程序 OCR。 主要问题是噪声或不是文本但它们存在于二进制图像中的对象。 现在我想到了从图像中提取文本。

我需要一些好的算法。 你能推荐一个非常好的吗? 例如,如果图像包含黑色文本和类似黑线的东西 那么该算法将只选择没有行的文本。

【问题讨论】:

  • OCR 已经有一段时间了。您有什么理由需要构建自己的,而不是寻找现有的工具?至于算法,我相信有很多。通常,您需要有要搜索的字符的现有模板,然后让程序查看图像中是否存在这些模板。
  • 如果图像包含清晰的文本,即使手写文本的 ocr 对这些图像也不是很好,其他工具也可以工作。我试过 tesseract google,gocr。字符模板是什么意思?
  • @maxiumus:OCR 系统需要一些参考点,它需要知道正确的“A”是什么样子才能识别出可能是“A”的图像”。实现这一目标的方法可能不止一种,所建议的只是其中一种方法。
  • 你可能会看这里:stackoverflow.com/questions/1284214/…

标签: algorithm image-processing ocr


【解决方案1】:

您描述了两种要消除的噪音。 (顺便说一句,用于降噪的wikipedia page 还不错,请查看“图像中”部分)。

一种是奇点噪声。这通常被称为“斑点”或“椒盐”噪声,通常被某种平均滤波器去除。 mathworks 有一个很好的页面描述了一些算法。

第二种是线条。这更难,我不会真正将其描述为噪声,它取决于您输入的图像类型。 This paper 似乎很合适,但它不是在线免费提供的,因此您可能需要购买它或去当地的大学图书馆。

你可能还想看看this,它可以从很多地方下载,但它确实是用于电影(视频)的,所以可能不是你想要的。

【讨论】:

    猜你喜欢
    • 2020-03-28
    • 2011-12-08
    • 2020-11-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-02-18
    相关资源
    最近更新 更多