【发布时间】:2016-07-31 03:09:14
【问题描述】:
对于多类案例,我无法正确调用 Scikit 的逻辑回归。我正在使用 lbgfs 求解器,并且确实将 multi_class 参数设置为多项式。
我不清楚如何在拟合模型时传递真实的类标签。我假设它与随机森林分类器多类相似/相同,您在其中传递 [n_samples, m_classes] 数据帧。但是,在执行此操作时,我收到一个错误,即数据形状不正确。 ValueError: bad input shape (20, 5)——在这个小例子中,有 5 个类,20 个样本。
在检查时,fit 方法的文档说真值作为 [n_samples, ] 传递——这与我得到的错误相匹配——但是,我不知道如何用多个训练模型类。所以,这是我的问题:如何将完整的类标签集传递给 fit 函数?
我无法在 Internet 上找到用于建模的示例代码,也无法在 StackOverflow 上找到这个问题。但我觉得肯定有人知道该怎么做!
在下面的代码中,train_features = [n_samples, nn_features], truth_train = [n_samples, m_classes]
clf = LogisticRegressionCV(class_weight='balanced', multi_class='multinomial', solver='lbfgs')
clf.fit(train_features, truth_train)
pred = clf.predict(test_features)
【问题讨论】:
标签: python machine-learning scikit-learn logistic-regression