如何获取图像中某些文本的坐标？答案

【问题标题】：How do I get the coordinates of some text thats part of an image?如何获取图像中某些文本的坐标？
【发布时间】：2010-07-05 13:26:15
【问题描述】：

我想根据放置在其中的各种文本标记来剪切图像。标记的字体/大小由我决定。

我知道商业 OCR 包在他们的 API 中提供了这个，但我希望我可以自己编写代码。

理想情况下，我不必逐个像素地与标记文本的图像进行比较。

我擅长 C++/C#、Java、PHP 和其他存在此类库的语言...

【问题讨论】：

【解决方案1】：

理想情况下，我不必去像素像素并与图像进行比较标记文本。

好吧，如果你想找到标记图像，那么这正是你必须做的。

这是一个想法...将标记文本设置为特定颜色，然后处理背景图像以确保它没有任何该颜色的像素。到那时，找到标记应该会变得容易得多。

【讨论】：

【解决方案2】：

条形码比文本标记更容易检测。您始终可以将它们放在一起，条形码用于自动位置检测，文本用于人类用户。

【讨论】：

【解决方案3】：

如果您想做一个非常完善的解决方案，您可以使用霍夫变换。它通常用于增强现实的东西 - 有必要在图像中找到某个标记。 Ofc 你将不得不稍微改变你的标记，这可能吗？ ;-) 霍夫将为您提供标记线的位置，从而为您提供要剪切的区域。

这是一个关于 hough 的链接，但还有很多其他的。

或者这个

【讨论】：

【解决方案4】：

fiduciary marker 会比文字更好。这就是他们用于增强现实等的东西。

如果文本的大小、形状和方向始终相同，则可以使用normalized cross-correlation。

“理想情况下，我不必逐个像素地与标记文本的图像进行比较。”

那你还打算怎么做呢？您只搜索图像的一部分？

【讨论】：