【问题标题】:Multiclass classification using Gaussian NB, gives same output for accuracy, precision and f1 score使用 Gaussian NB 的多类分类,为准确度、精度和 f1 分数提供相同的输出
【发布时间】:2020-08-16 13:47:06
【问题描述】:

我是 Python 和分类算法的新手。我正在使用 GaussianNB 进行 NSL KDD 数据集的多类分类,最后我需要获得精度、召回率、f1 分数的值。

from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import confusion_matrix, zero_one_loss
from sklearn.metrics import classification_report

from sklearn.naive_bayes import GaussianNB

gnb = GaussianNB()
y_pred = gnb.fit(train_x, train_Y).predict(test_x)

results_nm = confusion_matrix(test_Y,y_pred)
#print(results_nm)
print(classification_report(test_Y,y_pred))
print(accuracy_score(test_Y,y_pred))
print("Precision Score : ",precision_score(test_Y,y_pred, 
                                           pos_label='positive',
                                           average='micro'))
print("Recall Score : ",recall_score(test_Y,y_pred, 
                                           pos_label='positive',
                                           average='micro'))
print(f1_score(test_Y,y_pred,average='micro'))

我按照类似问题中的说明进行操作 sklearn metrics for multiclass classification.

输出如下,但我得到的所有三个输出都相同。这可能是什么原因?

【问题讨论】:

    标签: python machine-learning scikit-learn multiclass-classification


    【解决方案1】:

    这可能会发生,正如您在混淆矩阵中看到的那样,所有 3 个指标的微观平均值实际上是相同的。

    在微平均法中,你对不同集合的系统的个体真阳性、假阳性和假阴性求和,然后应用它们来得到统计数据。例如,对于一组数据,系统的

    True positive (TP1)  = 12
    False positive (FP1) = 5
    False negative (FN1) = 10
    

    那么精度 (P1) 和召回率 (R1) 将是 (12/(12+5)) 和 (12/(12+10))

    如果 FP1 == FN1,那么它们都是一样的。

    对于不同的数据集,系统的

    True positive (TP2)  = 50
    False positive (FP2) = 7
    False negative (FN2) = 7
    

    那么精度 (P2) 和召回率 (R2) 将是相同的。

    现在,使用微平均法的系统的平均准确率和召回率为

    微平均 F 分数将只是这两个数字的调和平均值。

    因此,对于 FPFN 的特定值,所有这些指标可能都相同。从方程可以看出,如果FP1 + FP2 == FN1 + FN2,那么微平均精度和召回率是一样的。

    您可以通过多种方式将值放入等式中,以便所有 3 个指标给出相同的值,因此您可以尝试宏观平均或加权平均。

    【讨论】:

      猜你喜欢
      • 2019-01-19
      • 2020-04-16
      • 2018-11-15
      • 2020-10-02
      • 2015-10-03
      • 2018-03-03
      • 2016-06-19
      • 1970-01-01
      • 2013-01-26
      相关资源
      最近更新 更多