【发布时间】:2017-02-21 14:18:51
【问题描述】:
谱聚类中的特征值和特征向量在物理上是什么意思。我看到如果λ_0 = λ_1 = 0 那么我们将有 2 个连接的组件。但是,λ_2,...,λ_k 告诉我们什么。我不理解多重性的代数连通性。
我们能否对图表的紧密度或与两张图表的比较得出任何结论?
【问题讨论】:
标签: machine-learning cluster-analysis eigenvalue
谱聚类中的特征值和特征向量在物理上是什么意思。我看到如果λ_0 = λ_1 = 0 那么我们将有 2 个连接的组件。但是,λ_2,...,λ_k 告诉我们什么。我不理解多重性的代数连通性。
我们能否对图表的紧密度或与两张图表的比较得出任何结论?
【问题讨论】:
标签: machine-learning cluster-analysis eigenvalue
特征值越小,连接越少。 0 仅表示“断开连接”。
将此值视为您需要切割多少边以生成单独的组件。切割与特征向量正交 - 据说有一些阈值 t,这样低于 t 的节点应该进入一个组件,高于 t 的节点应该进入另一个。
【讨论】:
这在一定程度上取决于算法。对于几种光谱算法,特征值可以很容易地通过主成分分析来降低人类消费的显示维度。幂迭代聚类向量更难解释。
正如Roboto 先生已经指出的,特征向量垂直于分割膜(高斯核变换后的平面)。光谱聚类方法通常对密度不敏感(这就是您所说的“紧密度”吗?)本身 - 它们会发现数据差距。例如,在一个单位球内是否有 50 个或 500 个节点构成第一个集群并不重要;游戏规则的改变者是是否有干净的空间(一个很好的间隙)而不是一条细小的“面包屑”点(一系列微小的间隙)导致另一个集群。
【讨论】: