【问题标题】:Location of Language Files in Tesseract in a Java projectJava项目中Tesseract中语言文件的位置
【发布时间】:2013-11-21 21:22:35
【问题描述】:

我在 Java 项目中使用 Tesseract 的 Java 包装器 Tess4J 来获取土耳其语图像的 OCR。该项目具有从客户端调用的 Web 方法。我的问题是:我应该把土耳其语数据文件放在哪里?如果我将 tur.traineddata 文件放在项目文件夹中的某个位置,Tesseract 是否有效?还是我必须将 tesseract 安装到服务器机器并将 tur.traineddata 放在 tessdata 文件夹下?

【问题讨论】:

    标签: java ocr tesseract


    【解决方案1】:

    在 Tesseract 类 setDatapath(String path) 中有一个方法,您可以调用此方法来告诉 Tesseract 在哪里寻找语言文件以执行 ocr 例如假设您的 tessdata 文件夹位于 D:\My_Language_Files 文件夹中,那么您必须例如在 setDatapath() 方法中传递“D:\My_Language_Files”字符串

    Tesseract instance = Tesseract.getInstance(); instance.setDatapath("D:\My_Language_Files"); instance.setLanguage("eng");

    【讨论】:

      【解决方案2】:

      您可以将语言数据文件放在任何地方。请务必在 Init 方法中指定其位置或为其设置 TESSDATA_PREFIX 环境变量。

      【讨论】:

        猜你喜欢
        • 2011-10-20
        • 2016-11-21
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2021-02-11
        • 1970-01-01
        • 1970-01-01
        • 2020-12-18
        相关资源
        最近更新 更多