【问题标题】:Java OCR library recommendations? [duplicate]Java OCR 库推荐? [复制]
【发布时间】:2013-07-22 10:33:21
【问题描述】:

我需要检查大量图片,看看它们是否有关键字。谁能推荐一个好的、可靠的 OCR 库?我很乐意牺牲速度来换取准确性。

【问题讨论】:

标签: java ocr


【解决方案1】:

没有具有something to do with accuracy 的纯Java OCR 库。根据您的预算,您可以选择不是纯 Java,但可以从 Java 调用的东西:

  • 如果您有充足的时间但预算为零 - 您的选择是 Tesseract。它绝对是开源中最好的
  • 如果您的预算很少,并且您只需要运行一次此识别 - Cloud OCR API 服务将是您的最佳选择。它基于领先的商业级 OCR 引擎,并提供相当实惠的每个项目价格。免责声明:我为 ABBYY 工作
  • 如果您需要将此识别作为持续过程永远运行,那么您可能会认为购买专用转换软件在经济上更有效,例如this one,它具有API并且也可以从Java调用。但实际上有很多选择,如果您准备在许可方面投入一些预算。

【讨论】:

  • 仅供参考.. tesseract sux..wayyyy 需要进行大量预处理,但开源,最好只花费您需要进行准确处理的 $$.. 准确的 OCR 只是这些要求之一那就是“付费玩”
【解决方案2】:

如果您有计划不识别拉丁或数字符号,那么更好的方法是找到非 java 库,但从一些(外部)工具中选择并使用其他方式 (1) 来获取您的文本。 在 Linux 上,我通过命令行界面使用了楔形文字 (2)。

  1. 例如命令行界面和管道。

  2. 楔形文字已移植到 Linux,但我不知道 Windows 的工作命令行界面

【讨论】:

    猜你喜欢
    • 2014-01-21
    • 2010-10-18
    • 2011-03-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-06-01
    • 2011-01-10
    • 2014-05-10
    相关资源
    最近更新 更多