【问题标题】:How do I get the coordinates of some text thats part of an image?如何获取图像中某些文本的坐标?
【发布时间】:2010-07-05 13:26:15
【问题描述】:

我想根据放置在其中的各种文本标记来剪切图像。标记的字体/大小由我决定。

我知道商业 OCR 包在他们的 API 中提供了这个,但我希望我可以自己编写代码。

理想情况下,我不必逐个像素地与标记文本的图像进行比较。

我擅长 C++/C#、Java、PHP 和其他存在此类库的语言...

【问题讨论】:

  • OCR 肯定需要深入的信号理论知识。如果您甚至不知道从哪里开始,那么您不太可能自己编写此内容。为什么不想使用外部APIs?

标签: c# java c++ image ocr


【解决方案1】:

理想情况下,我不必去像素 像素并与图像进行比较 标记文本。

好吧,如果你想找到标记图像,那么这正是你必须做的。

这是一个想法...将标记文本设置为特定颜色,然后处理背景图像以确保它没有任何该颜色的像素。到那时,找到标记应该会变得容易得多。

【讨论】:

    【解决方案2】:

    条形码比文本标记更容易检测。您始终可以将它们放在一起,条形码用于自动位置检测,文本用于人类用户。

    【讨论】:

      【解决方案3】:

      如果您想做一个非常完善的解决方案,您可以使用霍夫变换。它通常用于增强现实的东西 - 有必要在图像中找到某个标记。 Ofc 你将不得不稍微改变你的标记,这可能吗? ;-) 霍夫将为您提供标记线的位置,从而为您提供要剪切的区域。

      这是一个关于 hough 的链接,但还有很多其他的。

      Hough

      或者这个

      Wiki

      【讨论】:

        【解决方案4】:

        fiduciary marker 会比文字更好。这就是他们用于增强现实等的东西。

        如果文本的大小、形状和方向始终相同,则可以使用normalized cross-correlation

        “理想情况下,我不必逐个像素地与标记文本的图像进行比较。”

        那你还打算怎么做呢?您只搜索图像的一部分?

        【讨论】:

          猜你喜欢
          • 2020-12-22
          • 2020-11-04
          • 2018-08-31
          • 2018-04-25
          • 1970-01-01
          • 2023-04-05
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          相关资源
          最近更新 更多