【发布时间】:2018-07-04 00:16:30
【问题描述】:
我的数据集中有一个文本列,我希望使用该列为所有存在的单词计算 IDF。 scikit 中的 TFID 实现,如 tfidfvectorize,直接给我 TFIDF 值,而不是单词 IDF。有没有办法让单词 IDF 给出一组文档?
【问题讨论】:
-
为什么不自己计算呢。这是一个简单的计算
-
TfidfVectorizer 有一个
idf_,您可以在拟合后使用它。 -
@Usernamenotfound 我一直沉迷于编写自己的代码来做我知道逻辑的事情。这导致我的效率低于其他了解图书馆直接功能的人。所以,除非必要,否则我会故意不写代码。
标签: python scikit-learn nlp tf-idf tfidfvectorizer