【发布时间】:2016-12-04 17:53:23
【问题描述】:
在使用 PCA 后,我在 2D 中可视化了一个数据集。 1 维是时间,Y 维是第一个 PCA 组件。如图所示,点(A,B)之间有较好的分离。但不幸的是,聚类方法(DBSCAN、SMO、KMEANS、Hierarchical)无法将这些点聚类在 2 个聚类中。正如你在 A 部分看到的,有一个相对的连续性,这个连续的过程结束了,B 部分开始了,与 A 和 B 之间的过去数据相比,存在相当大的差距。
如果您能向我介绍任何方法和算法(或根据数据的分布设计任何度量标准),以便能够在没有可视化的情况下分离 A 和 B,我将不胜感激。非常感谢。
这是上图(第一个)的 2 个 PCA 组件的图。另一个也是其他数据集的组件图,我也得到了不好的结果。
【问题讨论】:
标签: machine-learning cluster-analysis visualization distance pca