【发布时间】:2011-10-03 14:36:42
【问题描述】:
我正在浏览这个plagiarism detector 并尝试在 Haskell 中编写一个程序,该程序将读取一个文件并用同义词替换其中的一些单词。 Haskell 中是否有可用于此目的的字典?
另外,如果您有任何关于算法的输入或与此问题相关的任何其他输入,例如如何通过用同义词替换单词来避免更改语句的上下文,请发布。
【问题讨论】:
标签: haskell dictionary plagiarism-detection
我正在浏览这个plagiarism detector 并尝试在 Haskell 中编写一个程序,该程序将读取一个文件并用同义词替换其中的一些单词。 Haskell 中是否有可用于此目的的字典?
另外,如果您有任何关于算法的输入或与此问题相关的任何其他输入,例如如何通过用同义词替换单词来避免更改语句的上下文,请发布。
【问题讨论】:
标签: haskell dictionary plagiarism-detection
Haskell 中是否有可用于此目的的字典?
我想你正在寻找的是一个纯文本文件,像这样:
word1: word1synonym1, word1synonym2, ...
word2: word2synonym1, ...
...
在这种情况下,它实际上并不是 Haskell 特定的。我不知道有任何像这样的免费文本文件词库,但我想如果你在LibreOffice 周围挖掘,你可能会找到一个。
如何通过用同义词替换单词来避免更改语句的上下文
这对计算机来说很难做到,afaik。我建议不要在这方面花费太多精力。
关于算法的任何输入
您可能会发现edit distance 的概念对这个问题很有用。请参阅Approximate string matching 和Wagner-Fischer algorithm。
【讨论】: