【发布时间】:2016-11-30 04:52:48
【问题描述】:
如何使用以下训练数据将新数据集分为 A 类和 B 类?
1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 class
Dataset 1 42 13 22 324 270 96 107 93 80 228 A
Dataset 2 45 23 14 596 445 135 153 124 132 331 A
Dataset 3 42 22 16 479 407 130 150 121 128 342 A
Dataset 4 37 63 10 481 397 155 143 159 172 394 B
Dataset 5 46 18 10 387 356 127 118 129 136 359 B
Dataset 6 23 34 9 550 436 147 166 164 208 467 B
如果有一个方程可以划分数据集,那将是非常理想的。
例如,如果 # of 1.0 + # of 0.9 高于 55,则为 A 类。(这可能是错误的,但类似这样)
【问题讨论】:
-
想到的第一个想法:使用 bagging/boosting 让 10 个分类器中的每一个根据平均值进行投票。 stats.stackexchange.com/questions/18891/…
标签: machine-learning classification