【问题标题】:Unsupervised learning reduce dimensionality/clustering无监督学习减少维度/聚类
【发布时间】:2018-12-09 15:46:35
【问题描述】:

我正在尝试了解如何使用无监督学习将我的数据拆分为集群。例如,k-means 方法。

我有 20 列数据,如何将其投影到 2D 表面上而不会丢失 18 列中的必要信息?

我应该用什么来做到这一点?

任何帮助将不胜感激。

【问题讨论】:

  • 您不能为此使用 kmeans。聚类不是投影。

标签: artificial-intelligence cluster-analysis k-means unsupervised-learning dimensionality-reduction


【解决方案1】:

如果您只想查看二维数据,请考虑使用 t-SNE。 scikit-learn python 包有一个很好的实现,你可以使用。但是,请记住,您不应该将数据聚集在 t-SNE 输出上,因为您的数据所在的空间在此过程中会被充分扭曲(仅保留较短的距离,而较长的距离会被大量更改为更短或更长)

【讨论】:

  • 感谢您的回答。以及如何执行聚类?
  • 您应该使用 k-means 或光谱聚类等方法在原始未改变的空间上进行聚类。这些也在scikit-learn 中实现。
猜你喜欢
  • 1970-01-01
  • 2018-12-31
  • 2014-04-20
  • 2013-03-24
  • 2015-03-17
  • 2019-02-20
  • 2019-06-04
  • 2018-10-01
  • 2010-12-22
相关资源
最近更新 更多