【问题标题】:How to detect a word in an Image如何检测图像中的单词
【发布时间】:2009-11-04 12:49:04
【问题描述】:

我需要找出用户点击的图片中的单词。到目前为止,我已经成功地对图像进行了 OCR。我的 c# 应用程序中有一个图片框控件。用户可以在任何文本周围绘制一个框并将其拖动到文本框以填充文本框。我已经完成了这个。但是现在我有一个新要求,说用户可以选择一个文本框,然后单击图像中的一个单词,以便将该单词填充到文本框中。

我不知道如何继续。如何从图像中单独剪切单词部分并将其提供给 OCR。用户可以点击单词的任何部分。

请给我任何指示。我应该遵循什么算法来找到用户点击的单词的边界。如果我找到了边界,我可以使用 copyfromscreen 方法从图像中剪切它,并将其提供给 ocr 引擎以获取文本。

希望我在这里把我的问题说清楚了。

感谢和问候, 迪内什。

【问题讨论】:

  • 连接组件标签。为了让它更快,我用它sobelEdgeDetection filter > invert color进行了预处理。但这会减少需要处理的像素,但会丢失一些字母的连接性。

标签: c# image-processing ocr


【解决方案1】:

如果您的 OCR 正常工作,我最初的方法是尝试以初始点击点为中心进行某种搜索。

即。在用户点击的地方做一个小框,OCR,如果有噪音,做一个更大的框,OCR,重复直到 OCR 产生命中。

【讨论】:

  • 嗨,我试过了,但问题是即使是小图像,ocr 也很慢。所以这需要很多时间,如果用户在单词中间点击,我会有点正确。我一直在增加框的宽度,直到我得到的单词数为 2。但这不是最佳解决方案吗?
【解决方案2】:

如果您有 OCR 数据,根据 OCR 库,您可能能够执行反向查找并确定指定像素坐标处的字符。我使用过的 OCR 库为每个字符提供矩形坐标,而这些坐标又可以组合成单词(组合矩形)。那么问题就在于确定点击发生在哪个矩形内。

【讨论】:

  • 您好,我正在使用 Microsoft Office Document Imaging 12.0 库。我是否可以使用此库获取图像中字符的矩形坐标?如果不是我可以使用的其他库。你能告诉我你使用过哪些图书馆吗?如果我得到所有的直角坐标,我当然可以得到这个词。非常感谢。
  • 连接组件网标签算法 ??
猜你喜欢
  • 2021-12-29
  • 2017-06-14
  • 1970-01-01
  • 1970-01-01
  • 2017-07-26
  • 2019-09-10
  • 1970-01-01
  • 2023-03-31
  • 2017-04-30
相关资源
最近更新 更多