【发布时间】:2012-01-03 08:23:48
【问题描述】:
我正在编写一个桌面 UI (.Net WinForms) 来帮助摄影师清理他的图像元数据。有一个 66k+ 短语的列表。任何人都可以推荐一个好的开源/免费 .NET 组件,我可以使用它使用某种算法来识别潜在的合并候选者吗?例如,可能有两个或多个条目实际上是相同的单词或短语,它们的区别仅在于空格或标点符号甚至是轻微的拼写错误。该应用程序最终将依赖用户来整合短语,但拥有一种自动找到潜在候选人的有效方法将被证明是无价的。
【问题讨论】:
-
有关模糊文本匹配的更多信息,请参见此处:stackoverflow.com/questions/5859561/…
标签: c# fuzzy-search