【发布时间】:2018-09-02 14:56:49
【问题描述】:
假设我们使用给定的数据集训练自组织地图 (SOM)。聚类 SOM 的神经元而不是原始数据点是否有意义?看了this paper之后,我产生了这个疑问,其中陈述了以下内容:
此过程最重要的好处 是计算负载大大减少,使得 可以对大型数据集进行聚类并考虑几个 在有限的时间内不同的预处理策略。自然, 仅当使用 SOM 找到的集群时,该方法才有效 与原始数据相似。
在this answer 中明确指出 SOM 不包括聚类,但在 SOM 训练后可以在 SOM 上进行一些聚类过程。我认为这意味着聚类是在 SOM 的神经元上完成的,这在某种意义上是原始数据的映射,但我不确定这一点。所以,我想知道的是:
- 将训练的神经元权重作为数据点执行聚类算法的数据聚类是否正确?如果不是,那么如何使用 SOM 完成集群?
- 一般而言,数据集应具备哪些特征才能使这种方法发挥作用?
【问题讨论】:
标签: neural-network cluster-analysis data-science self-organizing-maps