【发布时间】:2023-03-18 12:30:01
【问题描述】:
我正在使用 tesseract 从图像中读取文本。由于我的 BinaryImage 输入不是纯白色背景上的简单文本,因此我只能得到 50% 的正确输出。
有什么方法可以预处理图像,以便我可以从 tesseract 获得正确的输出?我已经尝试过使用Otsu's method对图像进行灰度缩放和二值化,但没有任何改进。
由于我使用 java 完成所有这些工作,如果有人可以分享任何 java lib 的详细信息或步骤以从 tesseract 中获得更好的结果,那将会很有帮助。
我没有得到适当的 ImageMagick 文档来在我的 Java 代码中使用它。对此的任何帮助表示赞赏。
【问题讨论】:
标签: java imagemagick ocr tesseract