【发布时间】:2017-05-05 11:12:20
【问题描述】:
是否可以同时从 Tesseract 获得多个 PSM 模式以及纯文本和 HOCR 格式?
我目前在每个文档上运行 Tesseract 3 次:一次获取方向信息 (PSM 0),一次获取格式化文本 (PSM 3),一次获取 HOCR 格式化结果。这使得它需要 3 倍的时间。
有没有更好的方法从 Tesseract 获取此信息而无需多次 OCR 文档?
我正在使用这个PHP Tesseract wrapper.
$tess = new Tesseract();
$textor = $tess->recognize(storage_path("image.jpg"), null, 0);
$textplain = $tess->recognize(storage_path("image.jpg"), null, 3);
....
【问题讨论】: