【发布时间】:2020-01-18 13:47:27
【问题描述】:
我最近开始使用 SKLearn,尤其是分类模型,并且有更多关于用例示例的问题,而不是停留在任何特定的代码位上,所以如果这不是正确的提问地方,请提前道歉诸如此类的问题。
到目前为止,我一直在使用样本数据,其中基于已分类的数据训练模型。以“鸢尾花”数据集为例,所有数据都归入三个物种之一。但是,如果一个人想要在不知道分类的情况下对数据进行分组/分类怎么办。
让我们来看看这个虚构的数据:
Name Feat_1 Feat_2 Feat_3 Feat_4
0 A 12 0.10 0 9734
1 B 76 0.03 1 10024
2 C 97 0.07 1 8188
3 D 32 0.21 1 6420
4 E 45 0.15 0 7723
5 F 61 0.02 1 14987
6 G 25 0.22 0 5290
7 H 49 0.30 0 7107
如果想使用不同的功能将名称分成 4 个单独的分类,这是否可能,需要哪种 SKLearn 模型?我不是要任何代码,如果有人能指出我正确的方向,我完全可以自己研究?到目前为止,我只能找到分类已知的示例。
在上面的示例中,如果我想将数据分成 4 个分类,我希望我的结果是这样的(注意新列,表示类):
Name Feat_1 Feat_2 Feat_3 Feat_4 Class
0 A 12 0.10 0 9734 4
1 B 76 0.03 1 10024 1
2 C 97 0.07 1 8188 3
3 D 32 0.21 1 6420 3
4 E 45 0.15 0 7723 2
5 F 61 0.02 1 14987 1
6 G 25 0.22 0 5290 4
7 H 49 0.30 0 7107 4
非常感谢您的帮助
【问题讨论】:
标签: python scikit-learn classification multilabel-classification