【问题标题】:Scanned Image to Readable Text扫描图像到可读文本
【发布时间】:2010-10-11 03:25:02
【问题描述】:

我想知道有没有办法通过为其编写代码来获取带有文本的扫描图像以转换为可读文本?这可能吗?

【问题讨论】:

  • Java? php?哪一个?两个都? ...我喜欢OCRopus,因为它是由 teh goog 制作的!
  • @Tony 和 @matt 我想自定义编写它以实现我的项目。

标签: java php image documents scanning


【解决方案1】:

OCRTools 是我在.net 中使用的

对于Java,我过去使用过Aspire,它非常好,但有点吓人。我听说过很多关于tesseract 的事情,你不妨去看看。

如果您对答案感到困惑:您正在寻找的是光学字符识别软件的 API/SDK。您在问题中提出的问题指向从头开始构建 OCR。这需要了解图像处理(主要是对象识别)。

【讨论】:

  • 很好奇 Aspire 有什么可怕之处。可以分享吗?
  • 实际上我从批量扫描中获得了 Tiff 图像。阅读它们本身就非常令人困惑,我不得不使用另一个库(ImageMagick 或其他东西)来转换它们,然后不得不通过点击和试用来转换图像的一小部分并消除噪音等等......但那是版本1.something,现在是第 4 版...
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-05-26
  • 2017-05-20
  • 1970-01-01
相关资源
最近更新 更多