【发布时间】:2016-10-13 15:25:36
【问题描述】:
我在我的项目中使用来自 Scikit-learn 的 OneHotEncoder。而且我需要知道当n_value 设置为auto 时每个单热向量的大小是多少。我以为n_value_ 会证明这一点,但似乎除了尝试训练样本之外我别无他法。我制作了这个玩具示例代码来显示问题。你知道其他解决方案吗?
from sklearn.preprocessing import OneHotEncoder
data = [[1], [3], [5]] # 3 different features
encoder = OneHotEncoder()
encoder.fit(data)
print(len(encoder.transform([data[0]]).toarray()[0])) # 3 number of dimensions in one-hot-vector
print(encoder.n_values_) # [6] == len(range(5))
【问题讨论】:
标签: python machine-learning scikit-learn one-hot-encoding