【问题标题】:How to recognize text for scene images如何识别场景图像的文本
【发布时间】:2012-02-05 07:42:51
【问题描述】:

我正在尝试构建一个可以识别场景图像文本的系统(使用 C#)。我发现场景文本识别是一项具有挑战性的任务,因为分辨率低、背景复杂、闪电或模糊效果不均匀......

任何克服这个问题的想法都将不胜感激。

【问题讨论】:

  • 您目前取得了哪些成就,目前面临哪些挑战?
  • 感谢您的回复,我刚从头开始,现在我不知道我应该采用什么方法...
  • 你能附上一些典型图片的例子吗?
  • 很抱歉,我现在无法在帖子中附加图片。我之前需要一些声誉......

标签: c# image-processing ocr


【解决方案1】:

我想推荐以下论文来概述该领域提出的所有技术:

  • Jung,K., Kim, K.I., Jain, A.K., 2004。图像和视频中的文本信息提取:一项调查,模式识别 37(5), 977-997
  • 梁健、大卫·多尔曼和李惠平。 “基于相机的文本和文档分析:一项调查。”国际文档分析和识别期刊,7:2+3,第 83 -- 104 页,2005 年 7 月

虽然最大目的是从场景中识别文本字符,但如何找到文本区域然后提取文本比字符识别(OCR)本身更困难。

【讨论】:

    【解决方案2】:

    笔画宽度变换 (SWT) 可用于从自然图像中提取文本。

    查看这个 stackoverflow 页面:Stroke Width Transform (SWT) implementation (Java, C#...)

    这是一个有用的视频: http://videolectures.net/cvpr2010_epshtein_dtns/

    【讨论】:

    • 感谢您的帮助,Rethunk。但是现在我只关注文本识别,而不是论文提到的文本检测。我的问题的第一步是如何从场景图像中进行字符分割。我尝试使用二值化方法,但在字符重叠的情况下没有帮助。在这种情况下对我有什么想法吗?非常感谢。
    • 如果没有 SWT 或类似算法,您将很难在大多数图像中区分文本和背景,除非对比度非常高。二值化适用于白色背景上的黑色文本。研究局部阈值技术。为了避免重新创建各种已知算法,请查看 Gonzalez 和 Woods 的视觉教科书中的算法,以及 Cheriet、Kharma、Liu 和 Suen 的 Character Recognition Systems 一书中对 OCR 技术的调查。如果您正在尝试开发自己的 OCR 库,那么您的问题没有简短的答案。
    【解决方案3】:

    我建议您首先查看一些开源文本识别库。例如,参见this 线程。

    【讨论】:

      猜你喜欢
      • 2013-04-02
      • 2018-03-25
      • 2011-10-23
      • 2020-02-08
      • 2021-04-17
      • 1970-01-01
      • 2014-10-09
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多