【发布时间】:2015-05-17 18:11:50
【问题描述】:
我需要测量两个句子之间的相似度。例如:
s1 = "she is good a dog "
s2 = "she is nice a heel"
我需要证明"good" 与"nice" 相似。对于名词和动词,路径相似性的测量就像这个伪代码一样工作:
def get max :
for loop
(wn.synset ('dog ')).path_similarity(wn.synset ('animal'))
结果:.33,这是一个高值,那么这些词是相关的,我可以说是相似的。但是对于副词("nice" 和 "good"),.09 的值很低!
有什么想法吗?
【问题讨论】:
-
这应该是代码吗?!
-
我认为您的问题是“为什么 nice 和 good 不被视为同义词?”。也许你可以这样改写它,向我们展示你正在使用的真正的 python 代码,它给你 0.09 数字。
-
寻找两个句子之间的语义相似度的问题似乎比寻找巨大文档之间的相似度更复杂。 hindawi.com/journals/tswj/2014/437162.
标签: python nlp semantics wordnet