【问题标题】:Error in running tesseract OCR on Linux for .jpg在 Linux 上为 .jpg 运行 tesseract OCR 时出错
【发布时间】:2014-10-02 03:38:10
【问题描述】:

我按照this guide 成功在我的 Amazon EC2 实例上安装了 tesseract。它适用于 TIFF 图像,但是当我尝试在 JPG 上运行它时,我得到:

Tesseract Open Source OCR Engine v3.02.02 with Leptonica
Error in pixReadStreamJpeg: function not present
Error in pixReadStream: jpeg: no pix returned
Error in pixRead: pix not read
Unsupported image type.

我还需要安装/做什么?

【问题讨论】:

    标签: amazon-ec2 ocr tesseract


    【解决方案1】:

    我也遇到了同样的问题。这是由于您的 leptonica 安装可能有一些问题。再次尝试重新安装 leptonica:

    $tar -xvf leptonica-xx.tar.gz
    $cd leptonica folder
    $./configure
    $make
    $sudo make install    
    

    完成后,您可以通过以下方式检查所有库是否已正确安装:

    $tesseract -v
    

    然后它将显示已安装的 4 个库:

    tesseract 3.02.02
    leptonica-1.71
    libjpeg 6b : libpng 1.2.49 : libtiff 3.9.4 : zlib 1.2.3
    

    干杯:)

    【讨论】:

      【解决方案2】:

      我遇到了同样的问题,我必须手动安装所有图像库,然后重新安装 leptonica

      先安装这个

      sudo apt-get install libjpeg-dev libpng-dev libtiff4-dev
      

      然后重新安装 leptonica

      ./configure && make && sudo make install
      

      【讨论】:

      • 在 CentOS 6.7 上,即使安装了 libpng-devel,在重新安装 leptonica 后,tesseract -v 仍然会缺少 libpng 支持。
      • 我也重新编译了 tesseract。
      猜你喜欢
      • 1970-01-01
      • 2018-11-26
      • 1970-01-01
      • 2023-03-16
      • 1970-01-01
      • 1970-01-01
      • 2016-05-01
      • 2015-10-12
      • 1970-01-01
      相关资源
      最近更新 更多