【发布时间】:2018-09-12 06:12:32
【问题描述】:
str(df) 产生...
'data.frame': 699 obs. of 11 variables:
$ Code # : int 1000025 1002945 1015425 1016277 1017023 1017122 1018099 1018561 1033078 1033078 ...
$ Clump Thickness : int 5 5 3 6 4 8 1 2 2 4 ...
$ Uniformity of Cell Size : int 1 4 1 8 1 10 1 1 1 2 ...
$ Uniformity of Cell Shape : int 1 4 1 8 1 10 1 2 1 1 ...
$ Marginal Adhesion : int 1 5 1 1 3 8 1 1 1 1 ...
$ Single Epithelial Cell Size: int 2 7 2 3 2 7 2 2 2 2 ...
$ Bare Nuclei : int 1 10 2 4 1 10 10 1 1 1 ...
$ Bland Chromatin : int 3 3 3 3 3 9 3 3 1 2 ...
$ Normal Nucleoli : int 1 2 1 7 1 7 1 1 1 1 ...
$ Mitoses : int 1 1 1 1 1 1 1 1 5 1 ...
$ Class : Factor w/ 2 levels "2","4": 1 1 1 1 1 2 1 1 1 1 ...
我正在尝试对预测“类别”进行 10 次交叉验证 - 因子 2 是良性的,4 是恶性的。
我已经将数据框分成 10 个测试类,并且正在使用带有朴素贝叶斯分类的 predict() 函数来查找每个测试类的先验概率。
predict(nb, a, type = c("raw"))
nb = naive bayes classifier, a = first test class
以下是预测中的前几个值以供参考:
2 4
[1,] 1.000000e+00 3.671148e-09
[2,] 1.390736e-19 1.000000e+00
[3,] 1.000000e+00 1.238558e-09
[4,] 1.459450e-24 1.000000e+00
[5,] 1.000000e+00 9.585543e-09
[6,] 2.451592e-75 1.000000e+00
[7,] 1.379640e-03 9.986204e-01
[8,] 1.000000e+00 7.171687e-10
我无法找到 Benign(2) 和 Malignant(4) 类的先验概率的平均值。如何平均这些列并打印值?
【问题讨论】:
标签: r