【发布时间】:2021-05-11 14:02:48
【问题描述】:
这是我的数据框:
首先我尝试使用 MinMaxScaler 重新调整它:
array = df.values
X = array[:,1:5]
Y = array[:,5]
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler(feature_range = (0, 1))
rescaledX = scaler.fit_transform(X)
print(rescaledX[0:5,:])
[[1. 1. 1. 1. ]
[0.62941362 0.69159574 0.72880726 0.65628435]
[0.72207955 0.53431153 0.61756924 0.62263943]
[0.61745053 0.48542381 0.49937301 0.52598285]
[0.45269065 0.54966355 0.57468495 0.48724943]]
然后我尝试使用 RFE 和 LogisticRegression:
from sklearn.feature_selection import RFE
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
rfe = RFE(model, 2)
fit = rfe.fit(rescaledX, Y)
print("Number of attributes: %d" % fit.n_features_)
print(df.columns[0:5])
print("Attributes Selected: %s" % fit.support_)
print("Attribute Ranking: %s" % fit.ranking_)
但我得到的只是一条 ValueError 消息:
ValueError: Unknown label type: 'unknown'
有人可以帮我找出我的错误吗?
【问题讨论】:
-
这里的 Y 是什么?
-
我的错。我编辑了代码以阐明 X 和 Y 实际上是什么。
-
@JosédeCastro 您能否提供所有错误输出详细信息并指出它开始崩溃的代码部分?
标签: python scikit-learn sklearn-pandas