如何识别场景图像的文本答案

【问题标题】：How to recognize text for scene images如何识别场景图像的文本
【发布时间】：2012-02-05 07:42:51
【问题描述】：

我正在尝试构建一个可以识别场景图像文本的系统（使用 C#）。我发现场景文本识别是一项具有挑战性的任务，因为分辨率低、背景复杂、闪电或模糊效果不均匀......

任何克服这个问题的想法都将不胜感激。

【问题讨论】：

【解决方案1】：

我想推荐以下论文来概述该领域提出的所有技术：

虽然最大目的是从场景中识别文本字符，但如何找到文本区域然后提取文本比字符识别（OCR）本身更困难。

【讨论】：

【解决方案2】：

笔画宽度变换 (SWT) 可用于从自然图像中提取文本。

【讨论】：

感谢您的帮助，Rethunk。但是现在我只关注文本识别，而不是论文提到的文本检测。我的问题的第一步是如何从场景图像中进行字符分割。我尝试使用二值化方法，但在字符重叠的情况下没有帮助。在这种情况下对我有什么想法吗？非常感谢。
如果没有 SWT 或类似算法，您将很难在大多数图像中区分文本和背景，除非对比度非常高。二值化适用于白色背景上的黑色文本。研究局部阈值技术。为了避免重新创建各种已知算法，请查看 Gonzalez 和 Woods 的视觉教科书中的算法，以及 Cheriet、Kharma、Liu 和 Suen 的 Character Recognition Systems 一书中对 OCR 技术的调查。如果您正在尝试开发自己的 OCR 库，那么您的问题没有简短的答案。

【解决方案3】：

我建议您首先查看一些开源文本识别库。例如，参见this 线程。

【讨论】：