【发布时间】:2015-11-23 14:14:29
【问题描述】:
我一直在使用 tesseract 从分辨率为 200x200 或 200x100 dpi 的传真文档中识别 Iban 号码。文件质量很差。我正在使用 C#.net。如何提高传真文档和文本质量以提高 ocr 准确性?
【问题讨论】:
标签: image-processing ocr text-rendering
我一直在使用 tesseract 从分辨率为 200x200 或 200x100 dpi 的传真文档中识别 Iban 号码。文件质量很差。我正在使用 C#.net。如何提高传真文档和文本质量以提高 ocr 准确性?
【问题讨论】:
标签: image-processing ocr text-rendering
穆萨:
传真图像可能有点棘手。最初,您可以尝试缩放或重新调整非 DPI 图像的大小,使其对应于正方形分辨率(即 - 200x200)。
在此之后,这就是图像上的内容(文本字符及其外观)的问题。您可以执行许多图像操作,以帮助使文本对象更适合识别:
希望这会有所帮助。
【讨论】: