【发布时间】:2018-10-31 16:09:21
【问题描述】:
我想使用逻辑回归来查看银行账户余额、人的年龄和买房能力之间的相关性。 实现我的回归模型后,我得到了类型的混淆矩阵:
array([[1006, 0],
[ 125, 0]])
当我尝试对其他数据实施线性回归时就是这种情况。代码如下:
# importing dataset
dataset = pd.read_csv('/home/stayal0ne/Machine-learning/datasets/bank.csv', sep=';')
dataset['age'] = dataset['age'].astype(float)
dataset['balance'] = dataset['balance'].astype(float)
X = dataset.iloc[:, [0, 5]].values
y = dataset.iloc[:, -1].values
# splitting the dataset into the training and test sets
X_train, X_test, y_train, y_test = train_test_split(
X, y, test_size=0.25, random_state=42)
# encoding categorial data
label_encoder_y = LabelEncoder()
y = label_encoder_y.fit_transform(y)
# feature scaling
scale = StandardScaler()
X_train = scale.fit_transform(X_train)
X_test = scale.transform(X_test)
# Fitting classifier into the training set
classifier = LogisticRegression(random_state=42)
classifier.fit(X_train, y_train)
# Prediction
y_predicted = classifier.predict(X_test)
# Checking the accuracy
con_matrix = confusion_matrix(y_test, y_predicted)
任何帮助将不胜感激。
【问题讨论】:
-
帮助什么?问题是什么?
-
@desertnaut 第二列不应该是零,不是吗?
-
第二列可以为零,具体取决于数据集以及您解决问题的准确程度。看看提供的答案(我建议你接受它)
标签: python-3.x machine-learning logistic-regression