【问题标题】:How to analyze the t-SNE(KMeans) result in Python?如何在 Python 中分析 t-SNE(KMeans) 结果?
【发布时间】:2018-12-03 23:34:31
【问题描述】:

我已将 t-SNE 用于 KMeans 聚类,但在获得 t-SNE result 后,我无法理解如何将其与原始数据联系起来。有人可以帮我理解结果吗?接下来我应该怎么做才能通过与我的原始数据进行比较来更好地理解结果?

from sklearn.manifold import TSNE
fig, ax = plt.subplots(figsize = (10,8))
data = df2[['First_Policy_Year','Customer_Age','Educational_Degree','Customer_Monetary_Value','Total_Premium']].values
kmeans_clustering = KMeans( n_clusters = 3 )
idx = kmeans_clustering.fit_predict( data )

#use t-sne
X = TSNE(n_components=2, perplexity=10).fit_transform( data )

#fig = plt.figure(1)
#plt.clf()

#plot graph
colors = np.array([x for x in 'bgrcmykbgrcmykbgrcmykbgrcmyk'])
plt.scatter(X[:,0], X[:,1], c=colors[kmeans_clustering.labels_])
plt.title('K-Means (t-SNE)')
plt.show()

【问题讨论】:

标签: python-3.x cluster-analysis hierarchical-clustering sklearn-pandas dimensionality-reduction


【解决方案1】:

这个 tSNE 结果在我看来是随机的。

检查此highly voted answer on stats.SE。第三张图片显示的结构比你的要多 - 并且它被证明是错误的结构......

不要过度解释它。无论如何,这可能是错误的。

首先改进您的预处理。您 90% 的工作将是数据准备。

【讨论】:

    猜你喜欢
    • 2019-03-21
    • 1970-01-01
    • 2018-03-27
    • 2022-01-11
    • 2020-10-09
    • 2019-04-17
    • 1970-01-01
    • 2017-09-08
    • 1970-01-01
    相关资源
    最近更新 更多