【发布时间】:2009-01-23 05:06:15
【问题描述】:
我需要从 Java 应用程序服务器调用 tesseract OCR(它是 C++ 中的一个开源库,用于进行光学字符识别)。现在很容易使用 Runtime.exec() 运行可执行文件。基本逻辑是
- 将当前保存在内存中的图像保存到文件(.tif)
- 将图像文件名传递给 tesseract 命令行程序。
- 使用 FileReader 从 Java 读取输出文本文件。
通过为 Tesseract 编写 JNI 包装器,我可能会在性能方面获得多少改进?不幸的是,没有在 Linux 中工作的开源 JNI 包装器。我必须自己做,我想知道这样做的好处是否值得开发成本。
【问题讨论】:
-
能否请您粘贴您在 Runtime.exec() 中使用的命令以运行 tesseract 命令。我猜不出来...
标签: java java-native-interface ocr tesseract