【问题标题】:Get multiple Tesseract PSM and file formats at once一次获取多种 Tesseract PSM 和文件格式
【发布时间】:2017-05-05 11:12:20
【问题描述】:

是否可以同时从 Tesseract 获得多个 PSM 模式以及纯文本和 HOCR 格式?

我目前在每个文档上运行 Tesseract 3 次:一次获取方向信息 (PSM 0),一次获取格式化文本 (PSM 3),一次获取 HOCR 格式化结果。这使得它需要 3 倍的时间。

有没有更好的方法从 Tesseract 获取此信息而无需多次 OCR 文档?

我正在使用这个PHP Tesseract wrapper.

$tess = new Tesseract();
$textor = $tess->recognize(storage_path("image.jpg"), null, 0);
$textplain = $tess->recognize(storage_path("image.jpg"), null, 3);
....

【问题讨论】:

    标签: php tesseract


    【解决方案1】:

    tesseract 不支持在一次执行中运行多个PSM 模式和输出格式。

    如果性能是一个问题,您可以尝试multi-threading in PHP 为您的用例同时运行多个 tesseract。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2017-01-03
      • 2022-01-05
      • 2014-08-14
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-01-25
      • 2018-09-18
      相关资源
      最近更新 更多