【发布时间】:2018-03-25 07:36:06
【问题描述】:
我使用CountVectorizer 创建了一个矩阵,看起来像
[[1, 2, 1....],
[0, 4, 0,...],
[0, 0, 7....]]
每列映射到一个特征名称
['sweet', 'pretty', 'bad'....]
我想做的事
将矩阵的行转换为格式为
[{'sweet': 1, 'pretty': 2, 'bad': 1 ..} , {'sweet': 0, 'pretty': 4, 'bad': 0 ..} , {'sweet': 0, 'pretty': 0, 'bad': 7 ..}]
这基本上是在做DictVectorizer 的inverse_transform 函数会做的事情,但是由于我没有从字典中创建矩阵,我认为我不能使用它,因为我收到了这个错误
“DictVectorizer”对象没有属性“feature_names_”
我如何实现这一目标? NumPy 是否提供了一个内置函数来将数组转换为字典列表,我可以在其中将每一列映射到给定的键?
【问题讨论】:
-
将有助于提供一些样本
data
标签: python numpy scikit-learn