【问题标题】:.vocabulary_ vs .get_feature_names() [duplicate].vocabulary_ vs .get_feature_names() [重复]
【发布时间】:2019-06-22 01:34:21
【问题描述】:

这些与sklearnTfidfVectorizer 有关。

能否解释一下这两者之间的异同以及何时有用。

这很令人困惑,因为它们看起来非常相似,但又完全不同。

同样有限的sklearn 文档在这种情况下也没有多大帮助。

【问题讨论】:

  • @G.Anderson,谢谢这也有帮助。实际上,当我在寻找问题的答案时,我还没有找到这篇文章。

标签: python python-3.x scikit-learn tfidfvectorizer


【解决方案1】:

基本上,我认为它们包含完全相同的信息。

但是,如果您有术语的名称并且您在 tf-idf 矩阵中查找它的列位置,那么您可以选择 .vocabulary_

.vocabulary_ 将术语名称作为键,并将它们在 tf-idf 矩阵中的列位置作为值。

然而,如果您知道该术语在 tf-idf 矩阵中的列位置并查找它的名称,那么您可以选择 .get_feature_names()

.get_feature_names()中term的位置对应tf-idf矩阵中元素的列位置。

【讨论】:

    猜你喜欢
    • 2011-02-07
    • 2019-08-26
    • 2012-09-17
    • 2011-03-29
    • 2011-05-18
    • 2018-08-01
    • 2015-11-15
    • 2020-01-14
    • 2011-06-16
    相关资源
    最近更新 更多