【发布时间】:2014-07-16 17:36:12
【问题描述】:
我已经构建了一个系统来分割包含手写符号的二进制图像并对其进行分类(特别是对于音乐)。我知道有商业应用程序可以做到这一点,但这是我试图将它作为一个项目从头开始。
为简单起见,假设我的整个图像中有两个元素:
和
我已经构建了一些东西,可以将图像分割成区域并将它们分类。这在大多数情况下都可以正常工作。
但是,有时元素会发生接触,这时我的分类器就会崩溃。例如:
或
将两者分开的最佳方法是什么?我已经做了很多研究,但我认为我缺乏领域知识可能会让我失望!
我发现的东西:
- 模板匹配效果不好,符号是手写的
- 细化/侵蚀也不起作用,尤其是当两个锐角(右上方)重叠时,因为它们退化太多。
- 分水岭填充实际上不适用于两个复杂的形状
可能会奏效的事情,在我进入兔子洞之前,我会很感激“去做”或“避免”投票。
- 滑动不同大小的窗口 L->R 并尝试对其进行分类。选择具有最高正分类置信度的窗口和位置。
- 进行投影(水平和垂直)并在最小值处“剪切”图像(这将是相应轴上最薄的位置
【问题讨论】:
标签: opencv image-processing machine-learning image-segmentation