【发布时间】:2023-03-17 11:10:01
【问题描述】:
我有以下信息:
数千个数据集
一种计算相似度的方法,但数据点本身我无法在欧几里得空间中绘制它们
我知道 DBSCAN 应该支持自定义距离度量,但我不知道如何使用它。
说我有一个功能
def similarity(x,y):
return similarity ...
我有一个可以成对传递给该函数的数据列表,在使用 scikit-learn 的 DBSCAN 实现时如何指定它?
理想情况下,我想做的是获取集群列表,但我不知道如何开始。
还有很多术语让我感到困惑:
http://scikit-learn.org/stable/modules/generated/sklearn.cluster.DBSCAN.html
我如何传递一个特征数组,它是什么?我如何使这个实现适合我的需要?我将如何从该算法中获取我的“子列表”?
【问题讨论】:
标签: python scikit-learn cluster-analysis