Python OCR Tesseract 无法识别单个字符答案

【问题标题】：Python OCR Tesseract cannot recognize Single CharactersPython OCR Tesseract 无法识别单个字符
【发布时间】：2017-09-28 06:24:22
【问题描述】：

我有两张 TIF 图片。第一张图片（a.tif）是：

第二张图片（bcd.tif）是

当我使用 "tesseract a.tif a.txt" 时，它不会读取该字符和相同的命令 "tesseract bcd。 tif bcd.txt" 正在工作。我在 stackoverflow 中看到了一些答案，他们没有给出解决方案如何运行它。如果我们需要添加任何参数，这些是什么？

【问题讨论】：

标签： python ocr python-tesseract

【解决方案1】：

如您所说，您需要将模式更改为单字符模式，您可以使用以下命令在 python 中执行此操作

pytesseract.image_to_string(img_path , config="--psm 10")

【讨论】：

【解决方案2】：

似乎问题与图像中只有一个字符有关。例如，我尝试了这两个图像：

这个很好用。 Tesseract 报告对结果的置信度为 95%：

这个不行。

我还尝试在 PageSegMode 设置为 SingleChar 的情况下扫描该图像，然后扫描正常。

命令行参数应该是-psm 10。看到这个：https://stackoverflow.com/a/26418458/5894241

【讨论】：