【发布时间】:2013-02-09 14:49:52
【问题描述】:
我需要根据它们在不同介词中的分布(如代理、工具、时间、地点等)来找到自然出现的名词类别。我尝试使用 k-means 聚类,但帮助较少,效果不佳,我正在寻找的类有很多重叠(可能是因为类的非球形形状和 k-means 中的随机初始化)。
我现在正在使用 DBSCAN,但我无法理解此聚类算法中的 epsilon 值和 mini-points 值。我可以使用随机值还是需要计算它们。任何人都可以帮忙。特别是对于 epsilon,至少在需要时如何计算它。
【问题讨论】:
标签: data-mining cluster-analysis dbscan