【发布时间】:2014-02-28 10:19:04
【问题描述】:
现在我正在制作一个使用 Android OCR rmtheis(https://github.com/rmtheis/android-ocr) 作为脚手架的 OCR 应用程序。
但是,我还远远不够。
我的主要问题:
在扫描带有几种不同字体的超小文本时,它仅返回一小部分正确的包含字符 不相关的杂物,例如包含的图像和条形码(来自 在这种情况下是产品手册)。
自动对焦的循环方式是,如果您在图像最清晰时按下相机按钮,您可能会 0.02 秒为时已晚,扫描模糊图像。因此,当文本包含在所选视图中时,我更喜欢自动捕获。
是否有任何适用于 Android 的高质量 OCR 解决方案可以捕获棘手的小文本并几乎每次都正确处理?
澄清一下:我已经通过 android-ocr 项目使用了 tesseract(tess-two)
另一方面:它几乎每次都需要返回接近 100% 正确的结果。不需要语言支持,我只会用它来捕获诸如 842EAB842EAB842EAB84?2EAB842EAB842EAB 之类的代码,此外还有不相关的英文文本。因此,我根本不需要语言支持。
编辑:这似乎是我正在寻找的: http://www.abbyy.com/mobileocr/features/
有没有比 Abbyy 输出质量更高的解决方案?
【问题讨论】:
-
tesseract 是一个完善的库 - code.google.com/p/tesseract-android-tools
-
你确定它真的适合真正高质量的需求吗?扫描包含无关内容的微小文本时,会出现几个字符错误。
-
你有什么尝试 - 有关于提高扫描质量的好文档:code.google.com/p/tesseract-ocr/wiki/ImproveQuality
-
谢谢,但我希望 OCR 软件(或 OCR + 文本旋转软件)能够解决文本旋转等问题。而且我的意思不是 90/180/270 作为 gautam。我想 Android 应用程序构建这样的功能应该是相当标准的,所以我希望有一个多合一的包可以有效地从非常糟糕的图像中生成文本。
-
如果您需要比 ABBYY Mobile OCR Engine 更高的准确度,您应该尝试 Cloud OCR SDK (ocrsdk.com)。它使用与 ABBYY FineReader Engine 相同的核心技术——ABBYY 最强大的 OCR SDK。你可以在这里下载几个样本看看准确性:cloud.ocrsdk.com/Demo
标签: android ocr scanning autofocus