【发布时间】:2019-04-17 12:18:59
【问题描述】:
我目前使用 Tesseract 的 Python 程序出现错误。现在我在 Ubuntu 上进行测试,我没有问题(Tesseract v4 在官方仓库中)。我现在想在 Debian 下尝试它,因为官方 repo 没有 Tesseract v4,我必须从源代码 Tesseract 编译。我这样做:
git clone -b4.0.0 https://github.com/tesseract-ocr/tesseract
cd tesseract
mkdir build && cd build
cmake .. && make
make install
然后我这样做:
export LD_LIBRARY_PATH=/usr/local/lib
export TESSDATA_PREFIX=/usr/share/tesseract-ocr/
我的 tessdata 前缀包含所有经过训练的语言,但出现以下错误:
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file ./fra.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'fra\' Tesseract could\' t 加载任何语言!无法初始化 tesseract。')
我尝试将 TESSDATA_PREFIX 放到 ~/.profile 中,将其添加到同一文件中的 PATH var 中,但我仍然遇到问题
提前感谢您的帮助
【问题讨论】:
-
我认为您错过了 TESSDATA 目录中的最后一个
tessdata(正如错误消息告诉您的那样)。