【问题标题】:Object Detection for android with tesseract or OpenCV使用 tesseract 或 OpenCV 的 android 对象检测
【发布时间】:2013-06-18 17:29:15
【问题描述】:

我已成功地将 tesseract 集成到我的 android 应用程序中,它可以读取我捕获的任何图像,但准确性非常低。但大多数情况下,我在捕获后没有得到正确的文本,因为感兴趣区域周围的一些文本也被捕获了。

我只想准确地读取矩形区域中的所有文本,而不捕获矩形的边缘。我已经做了一些研究并在stackoverflow上发布了两次关于此的内容,但仍然没有得到满意的结果!

以下是我发的 2 个帖子:

https://stackoverflow.com/questions/16663504/extract-text-from-a-captured-image?noredirect=1#comment23973954_16663504

Extracting information from captured image in android

我不确定是继续使用 tesseract 还是使用 openCV

【问题讨论】:

  • 如果答案不令人满意,请尝试悬赏。如果您使用 openCV 路线,请确保为您将使用的相机配置它。
  • 使用tesseract,我有一个矩形区域,因此用户将要捕获的区域放置在该矩形内。但是在抓图的时候,如果稍微移动一下,得到的结果完全就是一个垃圾值。我认为 tesseract 没有帮助我。你能提供一些示例代码吗?
  • 自从我学生时代以来就没有玩过openCV,所以不,不是真的......但是看看你的另一个问题,彩票可能不是最好的尝试。尝试使用大号黑色粗体字体的空白白纸,然后从那里开始工作……照明、相机内部结构、对焦 - 它们都会妨碍 OCR。
  • 好吧,我也试过这种方式,如果文本是白色背景,那么它读起来很好。但是当我申请彩票时,大部分时间都给我垃圾值。我还尝试了各种照明条件,即使在良好的照明条件下,tesseract 在处理彩票时给我的结果也很差。我该怎么办?
  • 诅咒众神,彩票的人怎么敢努力伪造/OCRing彩票!因此,在对彩票进行 OCR 之前,您需要使用... RasterizerFilter 对其进行清理?在任何情况下,尝试过滤掉全息图/有趣的背景,使用高对比度等,并尝试将过滤后的输入传递给 OCR,而不是尝试进行读取任何内容的 OCR。

标签: android opencv computer-vision tesseract text-recognition


【解决方案1】:

提高OCR输出的解决方案是

  • 要么使用更多的训练数据来更好地训练它

  • 使用一些线性过滤器(灰度、高对比度、模糊)过滤它的输入

在聊天中,我们发布了一些描述 OCRing 中使用的过滤技术的链接,但没有发布示例代码。

发布的一些链接是

Improving input for OCR

How to train Tesseract

Text enhancement using asymmetric filters

OCR Classification

【讨论】:

【解决方案2】:

包括许多其他人的链接和答案,我认为最好退后一步,注意光学字符识别 (OCR) 实际上有两个基本步骤:

  • 文本检测:这是您问题的标题和焦点,它与定位图像中包含文本的区域有关。
  • 文本识别:这是实际识别发生的地方,检测到的本地化图像区域被逐个字符分割并分类。这也是 Tesseract 等工具发挥作用的地方。

现在,还有两个应用 OCR 的常规设置:

  • 受控:这些是从扫描仪或类似性质的图像中获取的图像,其中目标是文档,并且透视、比例、字体、方向、背景一致性等非常温顺。
  • 不受控制/场景:这些是更自然和野外的照片,例如那些从相机拍摄的,您试图识别街道标志、商店名称等的照片。

Tesseract as-is 最适用于“受控”设置。一般来说,除了场景 OCR,“重新训练”Tesseract不会直接改善检测,但可能会改善识别。

如果您希望改进场景文本检测,请参阅此work;如果您正在考虑改进场景文本识别,请参阅work。既然您询问了检测,检测参考使用最大稳定极值区域 (MSER),它具有过多的实现资源,例如见here

这里还有一个专门针对 Android 的文本检测项目:
https://github.com/dreamdragon/text-detection

正如许多人所指出的,请记住,识别仍然是一项开放的研究挑战。

【讨论】:

  • 非常感谢您花时间回答这个问题。你提供了很多重要的信息。我想我会想办法的。再次感谢!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2015-10-23
  • 2015-03-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-01-18
  • 2023-03-13
相关资源
最近更新 更多