【发布时间】:2019-05-24 13:47:39
【问题描述】:
您好,我正在使用 Gensim 来查找文档之间的相似度,因此我对文档进行 TF-IDF 并计算余弦相似度。当我有新文档时,我可以使用 index[tfidf[vec]] 计算该文档与以前文档的相似度,但是这样 TF-IDF 不会更新,并且在相似度计算中不考虑新词是否有更新 TF 的解决方案-IDF 快速而无需重新计算整个矩阵,或者什么是我的问题的最佳解决方案?
【问题讨论】:
标签: python gensim similarity tf-idf