【发布时间】:2023-12-22 13:18:02
【问题描述】:
我正在使用 Tesseract 库读取身份证信息。我尝试使用一些Google images 并获得了不错的效果,但是当我使用实时图像时,即从 iPhone 相机捕获图像时,我没有得到很好的效果。
我发现了 Tesseract 建议的一些预处理步骤。
1.修复 DPI(如果需要)最低 300 DPI。
iPhone摄像头实时抓图时如何设置图像的DPI?
2。修正文本大小(例如 12 pt 应该没问题)。
如何修复 iPhone 摄像头生成的大图的文字大小?
3.尝试修复文本行(去歪斜和扭曲文本)。
我读到 Tesseract 使用 Leptonica 库应用去扭曲文本。在这个预处理阶段,文本是否需要去扭曲或去扭曲。?
4.尝试修复图像的照明(例如图像没有暗部)。
我可以使用 OpenCV 对图像进行照明吗?
5.对图像进行二值化和去噪。
当我为实时图像应用阈值或自适应阈值时,我得到的二值化图像很差。
如何对这些实时图像进行二值化?
【问题讨论】: