【发布时间】:2020-01-11 14:30:34
【问题描述】:
当我使用下面的代码时:
from sklearn.feature_extraction.text import CountVectorizer
X = dataset.Tweet
y = dataset.Type
count_vect = CountVectorizer()
BoW = count_vect.fit_transform(X)
它以稀疏矩阵的形式返回词频文档。
我发现了如何获取稀疏矩阵的数据、索引和 indptr。
我的问题是如何获取列的名称(应该是特征或单词)?
【问题讨论】:
-
您认为这有帮助吗? - medium.com/@cristhianboujon/…
-
你可以使用 count_vect.get_feature_names()
标签: python sparse-matrix text-classification countvectorizer