【发布时间】:2020-04-19 20:42:40
【问题描述】:
光盘:我是 OCR 方面的新手,正在寻找将图像从低分辨率图像转换为文本的机会 image
我用不同的conf尝试了pytesseract,但它仍然无法将图像转换为文本。据我了解,在将图像发送到 tesseract 之前我需要进行某种预处理,我检查了相关问题中的一些选项,但仍然无法使用 pytesseract 进行文本识别。是否可以为成功的文本识别进行任何预处理或 tesseract 调整?感谢任何python代码示例,谢谢!
pytesseract.image_to_string(img, lang='eng')
附:我无法提高源图像的质量。
【问题讨论】:
-
是的,你会很幸运能从中得到任何有用的东西——但你可以付出一些努力将它变成白色背景上的黑色文本,这正是 PyTesseract 所针对的。但是您必须自己编写/查找代码:StackOverflow 不是代码编写服务。
-
请尝试解释更多您尝试过的内容,看看您是否可以在文档中找到有用的信息。你问的大部分内容都可以用谷歌搜索。如果您有一个具体的代码示例,但您想要的东西不起作用,那么您可以寻求建议。
标签: python ocr tesseract python-tesseract