【问题标题】:Locating Text within image在图像中定位文本
【发布时间】:2010-09-05 08:03:53
【问题描述】:

我目前正在做一个项目,我的目标是在图像中定位文本。到目前为止,我还没有对文本进行 OCR 处理。我想基本上获得图像中文本的边界。我正在使用 AForge.Net 成像组件进行操作。某种意义上的帮助?

2009 年 2 月 5 日更新: 从那以后,我在我的项目中走了另一条路线。但是,我确实尝试使用 MODI(Microsoft Office Document Imaging)获取文本。它允许您轻松地对图像进行 OCR 并从中提取文本。

【问题讨论】:

    标签: c# image image-processing artificial-intelligence


    【解决方案1】:

    这是一个活跃的研究领域。确实有大量关于该主题的学术论文。很难给你提供帮助,尤其是没有更多细节的情况下。您在寻找特定类型的文本吗?字体?仅限英语?你熟悉学术文献吗?

    “文本检测”是任何 OCR(光学字符识别)系统中的一个标准问题,因此在互联网上有大量的代码来处理它。

    我可以开始列出来自 google 的大量链接,但我建议您只需搜索“文本检测”并开始阅读 :)。也有充足的示例代码可用。

    【讨论】:

      【解决方案2】:

      识别图像中的文本确实是该领域研究人员的热门话题,但直到captcha's 成为防御垃圾邮件机器人的“规范”时才开始失控。为什么使用验证码作为保护?好吧,因为在图像中定位(和阅读)文本非常困难!

      我之所以提到验证码,是因为最大的进步*是在那个小区域内取得的,我认为你的解决方案最好在那里找到。 特别是因为验证码确实是关于在杂乱的图像中定位文本(或类似于文本的东西),然后尝试正确读取字母。

      因此,如果您能找到自己 a good open source captcha breaking tool,您可能拥有继续探索所需的一切...
      您甚至可以丢弃处理字符识别本身的最困难的代码,因为这些 OCR 用于读取扭曲的文本,而您不必这样做。

      *:“非研究人员”在可见、可用和实用信息方面的进步

      【讨论】:

      • 提到验证码的另一个原因可能是他的“项目”是什么。 :-)
      【解决方案3】:

      如果您同意为此使用在线 API,http://www.wisetrend.com/wisetrend_ocr_cloud.shtml 的 API 可以进行文本检测,而不仅仅是 OCR。

      【讨论】:

        【解决方案4】:

        Stroke width transform 可以为您做到这一点。这至少是微软为他们的手机操作系统开发的。关于实现的讨论是here at https://stackoverflow.com/

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 2016-12-08
          • 2017-02-07
          • 2013-05-20
          • 1970-01-01
          • 1970-01-01
          • 2017-07-15
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多