【发布时间】:2021-05-18 03:20:57
【问题描述】:
我有一个包含 61 行(用户)和 26 列的数据集,我在其上应用了 k-means 和其他算法的聚类。 标准化后首先在数据集上应用 KMeans。 作为之前的任务,我在对其进行规范化并识别出 10 个集群后对这些数据运行 k-means。 与此同时,我还尝试将这些集群可视化,这就是我使用 PCA 来减少特征数量的原因。
我写了以下代码:
UserID Communication_dur Lifestyle_dur Music & Audio_dur Others_dur Personnalisation_dur Phone_and_SMS_dur Photography_dur Productivity_dur Social_Media_dur System_tools_dur ... Music & Audio_Freq Others_Freq Personnalisation_Freq Phone_and_SMS_Freq Photography_Freq Productivity_Freq Social_Media_Freq System_tools_Freq Video players & Editors_Freq Weather_Freq
1 63 219 9 10 99 42 36 30 76 20 ... 2 1 11 5 3 3 9 1 4 8
2 9 0 0 6 78 0 32 4 15 3 ... 0 2 4 0 2 1 2 1 0 0
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
Sc = StandardScaler()
X = Sc.fit_transform(df)
pca = PCA(3)
pca.fit(X)
pca_data = pd.DataFrame(pca.transform(X))
print(pca_data.head())
给出以下结果:
0 1 2
0 8 -4 5
1 -2 -2 1
2 1 1 -0
3 2 -1 1
4 3 -1 -3
我想通过使用 PCA 显示我的数据集的图(集群)并解释结果? 我是这个领域的新手,非常感谢您的建议!
再次提前致谢。
【问题讨论】:
-
您想要它们是 3D 还是 2D? 2D 会更容易,但现在你有了 3D。
-
我想要二维!我可以改变 pca = PCA(2)
-
这能回答你的问题吗? How to plot clusters in python?
-
不,我找不到任何解决方案!
标签: python cluster-analysis k-means