【发布时间】:2013-02-09 14:02:25
【问题描述】:
我部分实现了the Stroke Width Transform algorithm。 我的实现很丑陋,但有些工作
我的实现给了我很多候选者(我使用一些规则来过滤它们)。但我仍然有很多非角色候选人。 我想使用神经网络(或其他 ML 算法)来过滤它们。
我的分类器应该使用什么功能?
我可以提取均值/标准差(组件的 SW 值)和宽度/高度。
例子:
红色矩形是候选字符 (实现不检测明暗字符,“路虎”检测错误是正常的) 组件过滤后的SWT图像
【问题讨论】:
-
如果你能把你得到的输出包括在内,那会很有帮助,所以我们可以看到哪些描述符可能有用。例如,我不知道是什么构成了您的(非)字符候选者,特别是因为您提到“我的实现很丑陋,但有些东西有效”。这意味着它可以产生任何类型的输出。
-
我添加了一个样本。稍后我将添加更多示例和一些有关组件的信息
-
这没有多大帮助。您将根据 SWT 转换的结果提取特征,对吗?因此,您需要在 SWT 之后包含生成的图像,而不是带有选定矩形的原始图像。
-
也许你的意思是这样的:hostingkartinok.com/…
-
很可能是这样,现在为了让每个人都更轻松,您可以只保留该图像中与您在输入图像中显示的矩形相对应的区域。
标签: machine-learning computer-vision neural-network