【发布时间】:2014-12-23 10:30:01
【问题描述】:
我正在研究使用 tf-idf 度量来查找两个句子/文档之间的相似性的项目。
我尝试了以下示例代码:
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
documents = (
"The sky is blue",
"The sun is bright"
)
tfidf_vectorizer = TfidfVectorizer()
tfidf_matrix = tfidf_vectorizer.fit_transform(documents)
cosine = cosine_similarity(tfidf_matrix[0:1], tfidf_matrix)
print cosine
两个句子的相似度是
[[ 1. 0.33609693]]
现在我的问题是如何以图形/可视化格式显示相似性。 类似于维恩图,其中交点值成为相似性度量或 matplotlib 或任何 python 库中可用的任何其他图。
提前致谢
【问题讨论】:
标签: python matplotlib visualization similarity