【发布时间】:2009-11-04 12:49:04
【问题描述】:
我需要找出用户点击的图片中的单词。到目前为止,我已经成功地对图像进行了 OCR。我的 c# 应用程序中有一个图片框控件。用户可以在任何文本周围绘制一个框并将其拖动到文本框以填充文本框。我已经完成了这个。但是现在我有一个新要求,说用户可以选择一个文本框,然后单击图像中的一个单词,以便将该单词填充到文本框中。
我不知道如何继续。如何从图像中单独剪切单词部分并将其提供给 OCR。用户可以点击单词的任何部分。
请给我任何指示。我应该遵循什么算法来找到用户点击的单词的边界。如果我找到了边界,我可以使用 copyfromscreen 方法从图像中剪切它,并将其提供给 ocr 引擎以获取文本。
希望我在这里把我的问题说清楚了。
感谢和问候, 迪内什。
【问题讨论】:
-
连接组件标签。为了让它更快,我用它sobelEdgeDetection filter > invert color进行了预处理。但这会减少需要处理的像素,但会丢失一些字母的连接性。
标签: c# image-processing ocr