【发布时间】:2019-06-13 03:33:28
【问题描述】:
我已经阅读了大量关于 pytesseract 的帖子,但我无法让它从一个死的简单图像中读取文本;它返回一个空字符串。
图片如下:
我尝试过对其进行缩放、灰度化以及调整对比度、阈值化、模糊化以及其他帖子中所说的所有内容,但我的问题是我不知道 OCR 想要更好地工作什么。它想要模糊的文字吗?高对比度?
要尝试的代码:
import pytesseract
from PIL import Image
print pytesseract.image_to_string(Image.open(IMAGE FILE))
正如您在我的代码中看到的那样,图像本地存储在我的计算机上,因此Image.open()
【问题讨论】:
-
是的,这仍然对我不起作用
-
根据新的事实(meta.stackoverflow.com/questions/379138/…) ,这个问题应该被编辑或关闭,因为提问者需要将他的原始图像存储在他的计算机上的解决方案。但是,我们不知道原始图像的外观如何,并且 Questionar 不接受他在原始问题中发布的图像的解决方案。因此,从逻辑的角度来看,这个问题是无法解决的。
-
@Martin 好吧,那是错误的。 OP显示了有问题的图片和相关代码。 OP 还显示了图像的打开——文件名无关紧要;都是本地的。这应该给你主要的指针:“我想使用本地图像” - 再次,它是问题中的图像,但它存储在本地,并且只是为了minimal reproducible example
-
你的建议也是错误的。就像其他人一样,我提供了对上传图像的图像处理,因为那是您可以使用的绝对点。因为答案需要图像处理,所以我需要知道我的起始图像是什么,并且我不知道他的本地图像是原始形式还是经过他“尝试”的一切。如果不能确定起始图像,则无法解决