【发布时间】:2020-07-02 17:48:40
【问题描述】:
我是 Java 新手。这是使用 tess4j 从图像/pdf 到文本的 OCR 代码。我只想修改它,使其从命令行输入中获取 OCR_file.png/OCR_file.pdf 而不是通过指定路径如下-
package tess4j;
import java.io.File;
import java.io.*;
import net.sourceforge.tess4j.*;
public class Test{
public static void main(String[] args) {
// ImageIO.scanForPlugins(); // for server environment
File imageFile = new File("//home//desktop//OCR_file.png");
ITesseract instance = new Tesseract(); // JNA Interface Mapping
// ITesseract instance = new Tesseract1(); // JNA Direct Mapping
instance.setDatapath("//home//desktop//tessdata"); // replace <parentPath> with path to parent directory of tessdata
// instance.setLanguage("eng");
try {
String result = instance.doOCR(imageFile);
System.out.println(result);
} catch (TesseractException e) {
System.err.println(e.getMessage());
}
}
}
【问题讨论】:
标签: java linux ocr tesseract tess4j