【发布时间】:2015-09-16 14:16:20
【问题描述】:
我希望使用 kmeans 算法对一些数据进行聚类,但我想使用自定义距离函数。有什么方法可以改变 scikit-learn 使用的距离函数吗?
我也会选择一个不同的框架/模块,它允许交换距离函数并可以并行计算 kmeans(我想加快计算速度,这是 scikit-learn 的一个很好的功能)
有什么建议吗?
【问题讨论】:
标签: python scikit-learn
我希望使用 kmeans 算法对一些数据进行聚类,但我想使用自定义距离函数。有什么方法可以改变 scikit-learn 使用的距离函数吗?
我也会选择一个不同的框架/模块,它允许交换距离函数并可以并行计算 kmeans(我想加快计算速度,这是 scikit-learn 的一个很好的功能)
有什么建议吗?
【问题讨论】:
标签: python scikit-learn
您可以尝试谱聚类算法,该算法允许您输入自己的距离矩阵(根据需要计算)。
它在凸边界上的性能对 K-means 没有什么好羡慕的,但在非凸问题(检测连通性)上也能胜任。查看更多here。
好消息是谱聚类是also implemented in scikit-learn。
希望对你有帮助。
【讨论】: