【问题标题】:tesseract training on WindowsWindows 上的 tesseract 训练
【发布时间】:2023-03-22 17:20:01
【问题描述】:

我正在尝试使用UB-Manheim 提供的二进制文件在 Windows 7 上为新语言训练 tesseract。我正在遵循the wiki 中描述的培训程序。 text2image 工作得很好并生成文件。但是,当我运行 tesseract ... box.train 时,我收到以下错误:

read_params_file: Can't open box.train

二进制文件缺少什么吗?是否可以在 Windows 上训练 tesseract 还是应该切换到 Linux?

【问题讨论】:

    标签: tesseract


    【解决方案1】:

    您需要tessdata\configs 文件夹下的configs 文件。

    【讨论】:

    • 非常感谢!我无法得到“box.train”参数是配置文件的路径,而不是某个“选项”。你为我节省了很多时间!
    【解决方案2】:

    我建议你在 Linux 上训练 tesseract 并在 Windows 上使用 lang.traineddata我按照 批处理文件(train.sh) 在 Linux 上为波斯语训练了 tesseract 3.04,并在 Windows 上使用了 far.traineddata。

            for i in `ls -1 *.png`; do j=`echo $i| sed "s/\.png//"`;enter code heretesseract $i $j nobatch box.train; done
            unicharset_extractor *.box
            shapeclustering -F font_properties -U unicharset -O far.unicharset *.tr
            mftraining -F font_properties -U unicharset -O far.unicharset *.tr
            cntraining *.tr
            mv normproto far.normproto; mv inttemp far.inttemp; mv pffmtable far.pffmtable; mv shapetable far.shapetable
            combine_tessdata far.
    

    【讨论】:

      猜你喜欢
      • 2013-10-09
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-05-04
      • 1970-01-01
      • 2017-05-08
      相关资源
      最近更新 更多