【问题标题】:Aptfile: install a specific version of Tesseract-OCRAptfile:安装特定版本的 Tesseract-OCR
【发布时间】:2021-02-15 01:02:13
【问题描述】:

我在 Heroku 上部署了一个使用 Pytesseract 的应用程序。要在服务器上使用 Tesseract,我必须通过 Aptfile 安装 Tesseract

Aptfile

tesseract-ocr

在检查 Heroku Bash 后,我看到安装的 Tesseract 版本是 4.0.0。这个版本有一些影响我的应用程序的小错误(它不能很好地过滤字符,例如,像新版本那样)。如何在服务器上安装特定版本的 Tesseract-OCR?

【问题讨论】:

  • 你试过把版本放在包名后面吗?见:askubuntu.com/a/92021
  • 是的,但我收到此错误:Version '4.1.0' for 'tesseract-ocr' was not found,尽管 4.1.0 版本是官方版本之一
  • "sn-ps" 仅适用于可以在浏览器中运行的代码——javascript、HTML 等。使用{} 按钮进行所有其他类型的代码格式化,而不是 sn-p按钮。

标签: python heroku tesseract


【解决方案1】:

如何在服务器上安装特定版本的 Tesseract-OCR?

将版本放在包名之后。

来自the Ubuntu Manpage for apt-get

可以选择安装包的特定版本,方法是在包名后面加上等号和要选择的包的版本

来自heroku-buildpack-apt README

要了解可用的软件包,请参阅:https://packages.ubuntu.com

如果您使用 Heroku-20 堆栈(当前默认堆栈),您应该搜索 Ubuntu 20.04 的软件包,因为它是基础技术。来自the Heroku Stacks article

Stack Version Base Technology Available since Supported through Status
Heroku-20 Ubuntu 20.04 2020 April 2025 Default

Ubuntu packages for tesseract-ocr for 20.04中当前包的版本是4.1.1-2build2

包:tesseract-ocr (4.1.1-2build2) [universe]

在这种情况下,Aptfile 行可能是:

tesseract-ocr=4.1.1-2build2

这就是您安装特定版本的方式。

在您的情况下,我猜您正在使用 Heroku-18,因为根据Ubuntu packages4.00~git2288-10f4998a-2 是 Ubuntu 18.04 的 tesseract-ocr 版本,并且尝试安装更高版本可能会失败,因为它不可用。如果是这种情况,我建议使用 Heroku-20,它应该默认使用该软件包的更新版本。

【讨论】:

    猜你喜欢
    • 2018-11-26
    • 2014-07-10
    • 2018-02-25
    • 1970-01-01
    • 2018-07-30
    • 1970-01-01
    • 1970-01-01
    • 2019-03-24
    • 2016-05-01
    相关资源
    最近更新 更多