【发布时间】:2013-04-15 11:44:26
【问题描述】:
我有一个 1000 维的数据集,我正在尝试使用 Python 中的 DBSCAN 对数据进行聚类。我很难理解要选择什么指标以及为什么要选择。
有人能解释一下吗?我应该如何决定将eps 设置为哪些值?
我对更精细的数据结构感兴趣,因此将min_value 设置为 2。现在我使用为 sklearn 中的 dbscan 预设的常规指标,但对于较小的 eps 值,例如 eps
我已阅读this question 以及关于 10 个维度的答案,我有 1000 个 :) 我也不知道如何评估我的指标,所以如果有更详细的解释会很有趣:评估您的指标!
编辑:或有关使用现有 python 实现处理高维数据的其他聚类算法的提示。
【问题讨论】:
标签: python cluster-analysis data-mining dbscan n-dimensional