【问题标题】:Python OCR Tesseract cannot recognize Single CharactersPython OCR Tesseract 无法识别单个字符
【发布时间】:2017-09-28 06:24:22
【问题描述】:

我有两张 TIF 图片。第一张图片(a.tif)是:

第二张图片(bcd.tif)是

当我使用 "tesseract a.tif a.txt" 时,它不会读取该字符和相同的命令 "tesseract bcd。 tif bcd.txt" 正在工作。我在 stackoverflow 中看到了一些答案,他们没有给出解决方案如何运行它。如果我们需要添加任何参数,这些是什么?

【问题讨论】:

    标签: python ocr python-tesseract


    【解决方案1】:

    如您所说,您需要将模式更改为单字符模式,您可以使用以下命令在 python 中执行此操作

    pytesseract.image_to_string(img_path , config="--psm 10") 
    

    【讨论】:

      【解决方案2】:

      似乎问题与图像中只有一个字符有关。例如,我尝试了这两个图像:

      这个很好用。 Tesseract 报告对结果的置信度为 95%:

      这个不行。

      我还尝试在 PageSegMode 设置为 SingleChar 的情况下扫描该图像,然后扫描正常。

      命令行参数应该是-psm 10。看到这个:https://stackoverflow.com/a/26418458/5894241

      【讨论】:

        猜你喜欢
        • 2017-08-27
        • 1970-01-01
        • 1970-01-01
        • 2021-03-11
        • 2020-07-28
        • 2015-01-13
        • 1970-01-01
        • 2012-03-26
        相关资源
        最近更新 更多