【发布时间】:2018-05-11 19:59:14
【问题描述】:
我们开发了一个使用 OCR 技术的网络应用程序。我们使用付费的 API 服务,效果很好。 我们的后端/服务器使用基于 Ruby/Rails 的 API,我们的前端/客户端使用 VUE.js。 现在 OCR 技术是服务器端的,但我们也希望进入离线/PWA(渐进式 Web 应用程序)市场,目前正在开发我们应用程序的离线版本。由于我们应用程序的 OCR 部分必须在客户端运行,我们将 OCR 技术也移动到客户端,这意味着我们必须使用某种与 PWA 兼容的 OCR 技术,例如JavaScript SDK
我可能已经搜索了整个互联网,但似乎并没有真正的解决方案。这一切都归结为两大供应商:
- tesseract / 可能是最大的 OCR 项目(开源)。他们提供了一个 JS SDK (tesseract.js) -> http://tesseract.projectnaptha.com/ 但这很糟糕。我们将结果与我们正在使用的 API 进行了比较,结果很糟糕。因此,我们不能使用它。
- ABBYY 这可能是网络上最著名的 OCR 提供商,他们以合理的价格提供 OCR 扫描。不幸的是,在打电话给他们之后,他们也没有为 PWA 提供任何解决方案,只针对本机应用程序
- 不幸的是,多个其他小项目使用了除 JS 库之外的所有内容
在放弃并考虑开发本机应用程序(这对我们来说将是成本密集型应用程序)之前,我考虑在这里询问是否已知任何我尚未考虑的 PWA 的 OCR 解决方案。谢谢
【问题讨论】:
-
你在 tesseract.js 中加载了 langdata 吗?
-
你试过OCRopus吗?我认为 The Vision API 可能会有所帮助
-
@DonMB >> 你有没有想过解决这个问题?
标签: javascript ocr progressive-web-apps