【发布时间】:2016-08-08 08:19:16
【问题描述】:
我需要从图像中提取文本,所以我发现 OCR 库很少
- 苔丝4j
这没有奏效,所以我转向 apache tika。
在 apacke tika 中,我尝试了 ImageParser 和 JpegParser 。它正在提供文件信息,但未在我的图像文件中提供文本。
【问题讨论】:
-
你try reading the Apache Tika documentation on performing OCR了吗?如果是,你在哪里卡住了?如果不是为什么不呢?当你这样做时会发生什么?
-
是的,我阅读了 tika 文档。代码设置工作正常,但 Jpeg 解析器从一些图像返回文本,而不是从我必须提取的图像返回。
标签: java ocr apache-tika