【发布时间】:2017-07-12 11:35:49
【问题描述】:
给定一个变体长度特征列表:
features = [
['f1', 'f2', 'f3'],
['f2', 'f4', 'f5', 'f6'],
['f1', 'f2']
]
其中每个样本都有不同数量的特征,特征 dtype 是 str 并且已经很热门了。
为了使用 sklearn 的特征选择实用程序,我必须将 features 转换为二维数组,如下所示:
f1 f2 f3 f4 f5 f6
s1 1 1 1 0 0 0
s2 0 1 0 1 1 1
s3 1 1 0 0 0 0
我如何通过 sklearn 或 numpy 实现它?
【问题讨论】:
标签: python pandas numpy scikit-learn