【问题标题】:Handwritten scanned Doc to .txt File?手写扫描文档到 .txt 文件?
【发布时间】:2012-01-04 06:39:53
【问题描述】:

有没有可以将手写扫描文档转换为txt文件的JAVA API或工具?

我已经尝试过 google tesseract 和其他一些工具,但是对于手写扫描文档,我没有得到令人满意的结果。

【问题讨论】:

  • 通常,能够解码手写文本的软件仅限于处理非常狭窄的特定领域类型的文本(例如银行支票、邮政地址),并使用特定领域的知识。如果你得到一个通用的手写解析工具,请发表一篇研究论文,它仍然领先于最先进的技术。

标签: java linux ocr


【解决方案1】:

奇怪的是,这里的其他答案都指向 OCR 工具,而问题清楚地说明了手写识别。

手写是比 OCR 更难的领域,可用的技术数量非常有限。我认为您找不到任何开源工具,尽管商业供应商很少:

我不知道他们是否有Java API,但最好从联系他们开始研究。

【讨论】:

    【解决方案2】:

    你可以试试Java OCR Project。我认为您可以自己编写文本文件部分。

    此外,手写往往因人而异,因此我想您需要选择一些好的训练数据才能获得好的结果。

    【讨论】:

      【解决方案3】:

      看看这些:

      1. Java OCR

        • Java OCR 是一套用于图像处理和字符识别的纯 Java 库。提供模块化结构以便于部署。
      2. GOCR

        • GOCR 是一个 OCR 程序,在 GNU 公共许可证下开发。它将扫描的文本图像转换回文本文件。

      【讨论】:

      • 可以在windows上使用GOCR吗? ?我下载了它,但无法在windows上运行..请帮助....
      猜你喜欢
      • 1970-01-01
      • 2012-04-04
      • 2018-11-14
      • 2020-05-18
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多