【问题标题】:debian Tesseract TESSDATA_PREFIX issuedebian Tesseract TESSDATA_PREFIX 问题
【发布时间】:2019-04-17 12:18:59
【问题描述】:

我目前使用 Tesseract 的 Python 程序出现错误。现在我在 Ubuntu 上进行测试,我没有问题(Tesseract v4 在官方仓库中)。我现在想在 Debian 下尝试它,因为官方 repo 没有 Tesseract v4,我必须从源代码 Tesseract 编译。我这样做:

git clone -b4.0.0 https://github.com/tesseract-ocr/tesseract
cd tesseract
mkdir build && cd build
cmake .. && make
make install

然后我这样做:

export LD_LIBRARY_PATH=/usr/local/lib  
export TESSDATA_PREFIX=/usr/share/tesseract-ocr/

我的 tessdata 前缀包含所有经过训练的语言,但出现以下错误:

pytesseract.pytesseract.TesseractError: (1, 'Error opening data file ./fra.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \'fra\' Tesseract could\' t 加载任何语言!无法初始化 tesseract。')

我尝试将 TESSDATA_PREFIX 放到 ~/.profile 中,将其添加到同一文件中的 PATH var 中,但我仍然遇到问题

提前感谢您的帮助

【问题讨论】:

  • 我认为您错过了 TESSDATA 目录中的最后一个 tessdata(正如错误消息告诉您的那样)。

标签: debian tesseract


【解决方案1】:

我遇到了同样的问题,我环顾四周,然后意识到问题实际上很简单,答案就在那里 - 错误消息明确说明了文件的预期位置,在tessdata 的父文件夹。

请确保将 TESSDATA_PREFIX 环境变量设置为“tessdata”目录的父目录

通过将 tessdata 文件夹 /usr/share/tesseract-ocr/4.00/tessdata 中的语言文件和训练数据(在我的情况下为 eng.traineddata 和 osd.traineddata)复制到上一级的父文件夹。

似乎配置文件希望文件是上一级的,所以 /usr/share/tesseract-ocr/4.00/

这些是我安装 Ubuntu 的正确位置

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2013-02-03
    • 2016-07-10
    • 2013-05-04
    • 1970-01-01
    • 1970-01-01
    • 2018-01-16
    • 2015-11-08
    • 2011-02-05
    相关资源
    最近更新 更多