【发布时间】:2018-04-22 21:32:56
【问题描述】:
我使用idx = kmeans(kddcup,5); 进行kmeans 聚类。 145586 条记录有 kddcup99 的 41 个特征,10% 的数据库子集分成 5 个集群,但是 MATLAB r2017a 给出了这个错误:
Kmeans 不能接受复杂的数据!
我在 MATLAB 中加载了一个数据库,它有 42 列而不是 41 列,这意味着第 42 列用于行类型(攻击、正常、...)并且不是功能,我不知道是否我应该保留第 42 行或删除它。
我不知道我的工作是否正确,或者该代码是否有错误。
【问题讨论】:
-
那么 42' 列是名义变量吗? Kmeans 不适用。
-
停止使用 KDDcup99 数据集。这很糟糕。