pytesseract 用于低分辨率 img答案

【问题标题】：pytesseract for low resolution imgpytesseract 用于低分辨率 img
【发布时间】：2020-04-19 20:42:40
【问题描述】：

光盘：我是 OCR 方面的新手，正在寻找将图像从低分辨率图像转换为文本的机会 image

我用不同的conf尝试了pytesseract，但它仍然无法将图像转换为文本。据我了解，在将图像发送到 tesseract 之前我需要进行某种预处理，我检查了相关问题中的一些选项，但仍然无法使用 pytesseract 进行文本识别。是否可以为成功的文本识别进行任何预处理或 tesseract 调整？感谢任何python代码示例，谢谢！

pytesseract.image_to_string(img, lang='eng')

附：我无法提高源图像的质量。

【问题讨论】：

是的，你会很幸运能从中得到任何有用的东西——但你可以付出一些努力将它变成白色背景上的黑色文本，这正是 PyTesseract 所针对的。但是您必须自己编写/查找代码：StackOverflow 不是代码编写服务。
请尝试解释更多您尝试过的内容，看看您是否可以在文档中找到有用的信息。你问的大部分内容都可以用谷歌搜索。如果您有一个具体的代码示例，但您想要的东西不起作用，那么您可以寻求建议。

标签： python ocr tesseract python-tesseract

【解决方案1】：

我可以使用下面的代码来识别图像。我觉得这个决议还是合理的。

import cv2
import pytesseract

img = cv2.imread("NvhpY.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

custom_config = '-l eng --oem 3 --psm 6 '
data = pytesseract.image_to_string(thresh, config=custom_config)
print(data)

结果

Kpekep

【讨论】：