【发布时间】:2020-09-10 15:10:37
【问题描述】:
我必须根据其他属性来预测学生所参加的课程类型。
prog 是一个分类变量,指示学生所参加的课程类型:“普通”(1)、“学术”(2) 或“职业”(3)
Ses 是一个分类变量,表示某人的社会经济等级:“低”(1)、“中”(2)和“高”(3)
read、write、math、science是他们在不同测试中的分数
honors是否已注册
import pandas as pd;
import numpy as np;
df1=pd.get_dummies(df,drop_first=True);
X=df1.drop(columns=['prog_general','prog_vocation'],axis=1);
y=df1.loc[:,['prog_general','prog_vocation']];
from sklearn.model_selection import train_test_split;
X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.30, random_state=42);
from sklearn.linear_model import LogisticRegression;
from sklearn.metrics import classification_report;
clf=LogisticRegression(multi_class='multinomial',solver='newton-cg');
model=clf.fit(X_train,y_train)
但在这里我收到以下错误:
ValueError: 错误的输入形状 (140, 2)。
【问题讨论】:
-
错误是什么?
-
ValueError: bad input shape (140, 2).
标签: python-3.x scikit-learn logistic-regression multilabel-classification