【发布时间】:2021-09-28 23:32:04
【问题描述】:
众所周知,逻辑回归广泛用于使用分类变量的分类问题。我开始探索是否可以对数值变量应用逻辑回归!
例如,假设我有一个数据框 (df),其中包括来自风力涡轮机的四个变量 (>3000 个数据集),如下所示
t wind speed pressure power_output
2012-03-01 00:00:00 7.5 900.12 788.1564
2012-03-01 00:00:10 8.5 900.86 991.8323
2012-03-01 00:00:20 5.6 900.72 985.0856
2012-03-01 00:00:30 8.9 900.29 879.3877
2012-03-01 00:00:40 10.1 900.58 1118.800
这里我的目标变量是power_output。基于其他变量,我想预测power_output。这可以通过logistic regression 实现吗?
值得注意的是,power_output 和 wind speed 之间的关系几乎类似于 S 形函数。
我已经编写了代码,但它没有使用continious 标签。并收到此错误ValueError: Unknown label type: 'continuous'
df=pd.read_csv('data.csv').dropna()
df.head()
X=pd.iloc[:,[0,2]].values
y=pd.iloc[:,3].values # power_output
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
from sklearn.preprocessing import StandardScaler
sc= StandardScaler()
X_train=sc.fit_transform(X_train)
X_test=sc.fit_transform(X_test)
from sklearn.linear_model import LogisticRegression
classifier=LogisticRegression(random_state=0)
classifier.fit(X_train,y_train)
y_pred=classifier.predict(X_test)
【问题讨论】:
-
不,不,不。 线性回归,或“连续”回归。
-
数据是非线性的,因此不能使用线性回归。
-
您可以在“线性”回归中使用非线性项,以说明给定数据生成过程的非线性。
标签: python regression logistic-regression