【发布时间】:2014-04-21 10:26:42
【问题描述】:
我得到如下数据集:-
patient id-1
Heart rate pattern-82 82 87 87 89 90 89 89 89 89
Blood pressure-110 71
Body temperature-37.2
SPO2-94
Sex-0
Age-8
Hereditary-1
Smoking-0
Alcohol Intake-0
Physical Activity-1
Diabetes-0
Blood Cholesterol-0
Obesity BMI-17.5
Status-0
(1=坏(真),0=好(假))
对于心率模式
>>>est = AdaBoostClassifier()
>>>est.fit(X_train,y_train)
>>>predictions = est.predict(X_test)
>>>r2_score(y_test,predictions)
0.46999999999999997
其余数据
>>>est = RandomForestClassifier(verbose=2)
>>>est.fit(X_train,y_train)
>>>predictions = est.predict(X_test)
>>>r2_score(y_test,predictions)
0.9
我只有 264 个用于训练和测试的测试数据。通过在 sklearn 中使用 AdaBoostClassifier() 仅挖掘 心率模式,我获得了 0.46999999999999997 的准确度。对于数据集的其余部分,我使用 RandomForestClassifier(verbose=2) 获得了 0.9 的准确度。
现在我需要将这两个结果组合成一个预测结果。由于心率是一个时间序列,我无法立即将这两个结果结合起来。连接这两个结果的最佳方法是什么?
【问题讨论】:
-
r2_score 是回归分数,而不是分类分数。要评估分类,请使用 f1_score、accuracy_score(仅适用于平衡类)或 roc_auc_score(仅适用于二元分类)。
-
@ogrisel r2 和 f1_score 有什么区别?在上述情况下,最准确和正确的是什么?我应该两个都管还是只管一个?
标签: python time-series classification scikit-learn prediction