【发布时间】:2018-07-03 09:10:04
【问题描述】:
我试图找出两个文档之间的不同之处。我正在使用 gensim,到目前为止已经获得了相似度分数。
有没有办法知道两个文档之间的差异分数和不同特征? 又该如何评价?
【问题讨论】:
-
对于一个通用域,你不认为 (1 - cosine_similarity) 可以衡量不同程度吗?
-
谢谢。这是我到目前为止所评估的。但我一直无法找出不同的特征。
标签: nlp nltk gensim cosine-similarity