【发布时间】:2017-07-11 06:06:36
【问题描述】:
我有一个单词库列表和一个存在拼写错误(错别字)的文本,我想根据库列表将单词拼写错误纠正为正确
例如
在单词列表中:
listOfWord = [...,"halo","saya","sedangkan","semangat","cemooh"..];
这是我的字符串:
string = "haaallllllooo ssya sdngkan ceemoooh , smngat semoga menyenangkan"
我想把拼写错误改成正确的:
string = "halo saya sedangkan cemooh, semangat semoga menyenangkan"
检查列表中每个单词的最佳算法是什么,因为列表中有数百万个单词并且有很多可能性
【问题讨论】:
-
为什么需要最好的算法?这可能是一个商业秘密并且极其复杂。您的解决方案需要多好?
-
我只是想知道找到这个解决方案的最佳算法,我已经尝试过但花了很长时间,因为我使用了蛮力技术@PeterWood
标签: python string algorithm nlp pattern-matching