【发布时间】:2018-02-15 00:59:44
【问题描述】:
我是这里的初学者,我一生都在努力理解另一个与我有相同问题的堆栈溢出帖子。 Logistic Regression:Unknown label type: 'continuous'
这是我下面的机器学习代码,shell 输出给我 ValueError: Unknown label type: 'continuous'
我想我理解我正在“将浮点数传递给一个分类器,该分类器期望分类值作为目标向量。如果将其转换为 int,它将被接受为输入(尽管这是否是正确的做法值得怀疑)它)。最好使用scikit的labelEncoder函数转换你的训练分数”
有人可以告诉我如何将 scikit 的 labelEncoder 函数合并到我的代码中吗?这是在说明分类器 X 和 y 之前实现的吗?无论我在做什么,我都在做错事。谢谢
import numpy as np
from sklearn import preprocessing, cross_validation, neighbors, utils
import pandas as pd
df = pd.read_csv('C:\\Users\\bbartling\\Documents\\Python\\WB
Data\\WB_RTU6data.csv', index_col='Date', parse_dates=True)
print(df.head())
print(df.tail())
print(df.shape)
print(df.columns)
print(df.info())
print(df.describe())
X = np.array(df.drop(['VAV6znt'],1))
df.dropna(inplace=True)
y = np.array(df['VAV6znt'])
accuracies = []
X_train, X_test, y_train, y_test =
cross_validation.train_test_split(X,y,test_size=0.50)
clf = neighbors.KNeighborsClassifier(n_neighbors=50)
clf.fit(X_train, y_train)
accuracy = clf.score(X_test, y_test)
print(accuracy)
【问题讨论】:
标签: python python-3.x machine-learning scikit-learn data-science