【问题标题】:Rough edged text after applying Otsu's threshold for text extraction应用 Otsu 阈值进行文本提取后的粗边文本
【发布时间】:2024-01-22 04:01:01
【问题描述】:

我正在尝试使用 Otsu 的阈值机制将文本与背景分开。即使算法将文本从背景中分离出来,生成的文本也有粗糙的边缘,这反过来又会降低文本识别的准确性。

应用阈值后的输入图像和输出图像如下:

我可以做些什么来只删除背景?我想保留原始图像中的文本,边缘清晰,没有中断或变薄。

【问题讨论】:

  • 请阅读How to Ask... “有人可以帮忙吗?”不是一个很好的问题。你想知道什么?输出正是您对应用 Otsu 所期望的。二值化图像总是看起来有点粗糙,因为您不再有任何渐变边缘过渡......
  • 您可以尝试局部区域阈值技术,例如 Niblack 阈值、Sauvola 阈值,甚至是 Feng 的方法。他们专注于基于区域的阈值
  • 您也可以在尝试上述步骤之前尝试局部直方图均衡

标签: image-processing computer-vision image-segmentation text-extraction


【解决方案1】:

使用局部阈值操作而不是像 Otsu 这样的全局阈值操作会获得更好的结果。

但是你不应该期望太多。平滑的边缘是前景和背景之间渐变过渡的结果。您很可能在同一个字符中拥有与您认为前景相同的像素值和您认为背景中的其他像素...

如果您想要更好的结果,您应该提高输入图像的质量。

【讨论】: