【问题标题】:pytesseract for low resolution imgpytesseract 用于低分辨率 img
【发布时间】:2020-04-19 20:42:40
【问题描述】:

光盘:我是 OCR 方面的新手,正在寻找将图像从低分辨率图像转换为文本的机会 image

我用不同的conf尝试了pytesseract,但它仍然无法将图像转换为文本。据我了解,在将图像发送到 tesseract 之前我需要进行某种预处理,我检查了相关问题中的一些选项,但仍然无法使用 pytesseract 进行文本识别。是否可以为成功的文本识别进行任何预处理或 tesseract 调整?感谢任何python代码示例,谢谢!

pytesseract.image_to_string(img, lang='eng')

附:我无法提高源图像的质量。

【问题讨论】:

  • 是的,你会很幸运能从中得到任何有用的东西——但你可以付出一些努力将它变成白色背景上的黑色文本,这正是 PyTesseract 所针对的。但是您必须自己编写/查找代码:StackOverflow 不是代码编写服务。
  • 请尝试解释更多您尝试过的内容,看看您是否可以在文档中找到有用的信息。你问的大部分内容都可以用谷歌搜索。如果您有一个具体的代码示例,但您想要的东西不起作用,那么您可以寻求建议。

标签: python ocr tesseract python-tesseract


【解决方案1】:

我可以使用下面的代码来识别图像。我觉得这个决议还是合理的。

import cv2
import pytesseract

img = cv2.imread("NvhpY.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)[1]

custom_config = '-l eng --oem 3 --psm 6 '
data = pytesseract.image_to_string(thresh, config=custom_config)
print(data)

结果

Kpekep

【讨论】:

    猜你喜欢
    • 2023-03-21
    • 2019-04-26
    • 1970-01-01
    • 1970-01-01
    • 2020-11-12
    • 2015-04-26
    • 1970-01-01
    • 2011-04-07
    • 1970-01-01
    相关资源
    最近更新 更多